图书中心

大数据与人工智能首页>图书中心>IT新学科新专业

面向人体视觉理解的混合监督学习技术
  • 书     名:面向人体视觉理解的混合监督学习技术
  • 出版时间:2025-06-23
  • 编 著 者:杨录 宋晴
  • 版       次:1-1
  • I  S  B N:978-7-5635-7555-8
  • 定       价:¥0.00元

内容简介线

人体视觉理解技术是计算机视觉领域的重要组成部分,由于人类往往作为图片、视频等多媒体产物的核心研究对象,因此对图片或视频中的人体进行分析和理解是非常有必要的。人体视觉理解是基于计算机视觉技术的一系列人体相关任务的综合,通过对于多个维度人体信息的分析,能够更好的促进对于图像、视频中与人相关内容的理解。现有的人体视觉理解解决方案主要基于单数据源多任务学习或者多个单任务学习组合的方法。但是单一数据源多任务标注的难度较大、成本较高,而多个单任务组合的方法效率较低、忽视了任务之间的相关性。因此,为了高效且精准地解决人体视觉理解问题,往往需要多个数据源来共同完成多种任务的学习。 本书基于多数据源多任务学习的思想,提出了一种面向人体视觉理解的方法:混合监督学习(Mix-Supervised Learning, MSL)。混合监督学习是一种共享主干的多任务学习架构,它采用区域卷积网络作为基础,其中不同的任务可以共享同一主干网络,并且可以并行处理用于特定任务的网络分支。在本书中,使用混合监督学习在五个不同的数据集上训练人体视觉理解模型,可以同时执行人体检测、人体实例分割、人体解析、人体姿态估计、密集姿态估计以及实例级人体部位检测六个人体视觉理解子任务

目录介绍线