人体动作识别技术

鉴于此,一些研究者开始使用光流特征[14] [15] 。Efros 等为了提高低分辨率图像序列中运动信息提取的鲁 棒性,构造了新的基于光流的描述子用于在线] 。其主要思想是把光流场先分为水平、竖
直两种通道,然后每个通道再分为左、右两个通道, 然后利用高斯滤波器对四个通道进行滤波,最后进
行归一化得到运动描述子。Wang 等人受到图像分类 中的密集采样方法的启发,提出利用密集光流特征
随着视频获取设备和宽带网络的快速普及和发 的活动,不论是从安全、监控、娱乐,还是个人存
展,视频已成为信息的主要载体,且视频数据的数 量呈爆炸式增长,每时每刻都会有大量新的内容产
档的角度,对视频中人体动作识别进行研究具有重 要的学术和应用价值[1] 。基于视觉的人体动作识别
体可分为三类: 即非参数方法、立方体分析方法以 及参数化时间序列分析的方法[1] 。非参数方法通常 从视频的每一帧中提取某些特征,然后用这些特征 与预先存储的模板(template)进行匹配;立方体分析 方法不是基于帧的处理,而是将整段视频数据看作 是一个三维的时空立方体进行分析;而参数化时间 序列分析的方法对运动的动态过程给出一个特定的 模型,并通过对训练样本数据的学习获得每一类动 作特定的模型参数,其中比较常用的模型包括:隐 马尔可夫模型(HMMS, Hidden Markov Models),线 性动态系统(LDSs, Linear Dynamical Systems)等。
和保存的动作原型之间做形状匹配来完成动作识别 [5] ,其中,形状信息是以通过 Canny 边缘检测器检
种自底向上的方式从二维图像序列中恢复三维结构 信息。人体动作分析属于其中的高层视觉部分,近
从视频序列中提取出有效的运动特征是人体动 作识别中重要的一环,直接影响到动作识别的准确 度和鲁棒性,且同一特征对不同类别人体动作的描 述能力并不相同。因此,我们依据视频质量和应用 场景的不同,往往要选用不同类型的特征,这与具 体的应用场景以及研究者所关心的动作类别均有关 系。比如:在远景情况下,可以利用目标的运动轨 迹进行轨迹分析;而近景情况下,则需利用从图像 序列中提取的信息对目标的四肢与躯干进行二维或 三维的建模。
上述轨迹特征在物体检测、跟踪或是识别效果 不理想的情况下极易出错,尤其是在复杂的场景下。
位置,从而实现动作识别的目的。Liu 等用菲德勒嵌 入(Fiedler Embedding)的方法将旋转图像(Spin
1)(中国科学院智能信息处理重点实验室, 中国科学院计算技术研究所, 北京 100190) 2)(中国科学院大学,北京 100190)
——————————————— 收稿日期:2011年9月30日;最终修改稿收到日期:2013年6月27日 .本课题得到国家重点基础研究发展计划(973计划)项目课题(2009CB320906)、国 家自然科学基金(61025011, 61133003, 61035001, 61003165)、北京市自然科学基金(4111003)资助. 胡琼,女,1986年生,博士生(Rutgers, The State University of New Jersey),主要研究领域为计算机视觉与模式识别,. 秦磊(通讯作者),男,1977年生,博士, 副研究员,计算机学会(CCF)会员(E200021256M),主要研究领域为计算机视觉与模式识别, 黄庆明,男,1965年生,博士,教 授,博士生导师,国家杰出青年科学基金获得者,主要研究领域为多媒体分析、图像处理、计算机视觉、模式识别等,.cn. 手机号码:, E-mail:.cn
杂,运动对象较多的场景中尤为困难。因而有很多 研究者ued体育尝试新的研究思路,不再进行目标分割、目
本文将分别从动作识别特征、动作识别方法、 相关国际竞赛与常用数据库、研究难点与可能的发
静态特征主要描述的是人体目标的尺寸、颜色、 边缘[5] 、轮廓、形状[6] 和深度[9] 等。静态特征可以
计基于视觉的人体动作识别是图像处理、计算机视觉、模式识别、机器学习、人工智能等多个学科的交叉研究课题,
算 在视频监控、视频检索、人机交互、虚拟现实、医疗看护等领域具有深远的理论研究意义和很强的实用价值。本文从特征提
取的方法、动作识别的方法、相关国际竞赛与常用数据库、研究难点与可能的发展方向等方面详细阐述该领域目前的研究现
常见的形状、轨迹、光流、局部时空兴趣点等 特征可以分为以下四类(如表 1 所示):基于轮廓和 形状的静态特征,基于光流或运动信息的动态特征, 基于时空立方体的时空特征以及描述性特征。
学习并理解其中人的动作和行为[2] 。一般在运动检 测、特征提取的基础之上,通过分析获得人体运动 模式,建立视频内容和动作类型描述之间的映射关 系,以使计算机能够“看”视频或“理解”视频。 基于视觉的人体动作识别主要包含以下三个步骤:
的线 年 Johansson 通过经典的移动光 斑实验 (Moving Light Display) 心理物理学实验,证 实了仅通过观察连接在人体关节处的灯光信息,人 能够准确识别出走、跑、上楼梯等动作,甚至能够 从步态信息中识别出演员的性别和身份[10] ,预示了
近年来,人体动作识别的研究任务也在逐步地 发展,对计算机视觉领域提出了一些新的挑战。从
