室内位移估计与双足步态算法周期检测算法属于什么专业领域

在电子工程世界为您找到如下关于“估计算法”的新闻
H.264采用了减少视频图像各帧间冗余度的运动估计算法。运动估计算法传统的有全搜索(FS)、三步搜索(TSS)、新三步搜索(NTSS)、四步搜索(FSS)等;常用的是钻石搜索(DS)和非对称十字交叉多层次六边形格点运动搜索算法(UMHexagonS)。运动估计是整个视频编码中运算量最大的模块,可占整个软件编码器运算量的70%以上。因此视频系统中编码器的复杂部分...
(Additive WhiteGaussian Noise,AWGN)信道下的SNR 估计。该问题前人有较多研究成果。有导频辅助的SNR估计算法,导频符号的存在降低了传输效率;有多项式逼近算法,然而该算法只能用于BPSK 和QPSK信号;也有一种基于判决的估计算法,判决过程增加了实现复杂度;以及一种改进的M2M4算法,该算法在SNR较低时估计误差较大。本文提出一种基于信号包络均值...
H.264是现有最重要数据压缩编码国际标准之一。
快速运动估计算法一直是视频压缩中的研究热点。本文针对一些快速估计算法过早确定了搜索方向,容易陷入局部最小点,损失了搜索精度的情况,在原有基础上,运用菱形十字搜索算法(DCS)与阈值估计相结合的方法提高了运动估计的性能。实验结果表明,该算法可以用较小的搜索代价取得与全搜索(FS)相当的效果,并且在搜索速度方面优于钻石法DS...
则仅利用节点间距离的关联关系来计算目标节点位置。定位精度较Range-based算法稍差,但由于其降低了对节点硬件的要求,相对更适于无线传感器网络中的定位。典型算法有:DV-Hop、Sum-Dist、Euclidean等。这些定位算法都需要经过如图1所示的定位过程:
1 免测距距离估计算法1.1 Sum-Dist算法&&& Sum-Dist...
递推滤波算法如下:
  2 多传感状态融合估计算法
  单采样率多传感器状态融合估计的研究方法主要有基于概率论的方法、基于Kalman 滤波的方法、基于推理网络的方法、基于模糊理论的方法、基于神经网络的方法, 以及基于小波、熵、类论、随机集、生物学灵感、Choquet 积分的方法等等。基于Kalman 滤波的方法由于具有操作简单、计算量小、实时性强等优点...
H.264是现有最重要数据压缩编码国际标准之一。
快速运动估计算法一直是视频压缩中的研究热点。本文针对一些快速估计算法过早确定了搜索方向,容易陷入局部最小点,损失了搜索精度的情况,在原有基础上,运用菱形十字搜索算法(DCS)与阈值估计相结合的方法提高了运动估计的性能。实验结果表明,该算法可以用较小的搜索代价取得与全搜索(FS)相当的效果,并且在搜索速度方面优于钻石法DS...
∈[-0.5,0.5]是其小数部分。本文所要提出的是在接收系统进入跟踪阶段后的小数倍频偏△f的估计算法。
  2 小数倍子载波频偏估计
  频偏分为整数倍频偏和小数倍频偏,接收机首先在时域中对小数倍子载波频偏进行估计,以恢复子载波间正交性,在此基础上再进行FFT变化后到频域中进行整数倍子载波频偏估计。至此系统就可完成频偏捕获,然后进入跟踪阶段。本阶段再由导频处理模块进行小数...
滤波算法如下:
  2 多传感状态融合估计算法
  单采样率多传感器状态融合估计的研究方法主要有基于概率论的方法、基于Kalman 滤波的方法、基于推理网络的方法、基于模糊理论的方法、基于神经网络的方法, 以及基于小波、熵、类论、随机集、生物学灵感、Choquet 积分的方法等等。基于Kalman 滤波的方法由于具有操作简单、计算量小、实时性强等优点...
  摘要:H.264是现有最重要数据压缩编码国际标准之一。同时快速运动估计算法一直是视频压缩中的研究热点。本文针对一些快速估计算法过早确定了搜索方向,容易陷入局部最小点,损失了搜索精度的情况,在原有基础上,运用菱形十字搜索算法(DCS)与阈值估计相结合的方法提高了运动估计的性能。实验结果表明,该算法可以用较小的搜索代价取得与全搜索(FS)相当的效果,并且在搜索速度方面优于钻石...
估计算法资料下载
本文提出了一种基于时域PN 序列导频相关性的频偏估计算法,通过计算接收信号和发送信号共轭乘积的自相关函数,将频偏估计问题转化为一个单频谱估计问题,并且给出了简化的谱估计算法,从而避免了频率搜索,具有较低的实现复杂度,另外,此算法使用和符号同步相同的PN 序列资源,节省系统频谱资源。在多径信道下也给出了相应的形式,经过理论分析和仿真证明了,在多径信道下,改进算法的获得了频率分集增益,提高了估计性能...
ARMA谱估计算法,ARMA谱估计算法,ARMA谱估计算法,ARMA谱估计算法,ARMA谱估计算法,ARMA谱估计算法,ARMA谱估计算法,ARMA谱估计算法,ARMA谱估计算法,ARMA谱估计算法,ARMA谱估计算法,ARMA谱估计算法,...
随着通信技术和计算机技术的发展,多媒体的应用与服务越来越广泛,视频压缩编码技术也随之成为非常重要的研究领域。运动估计是视频压缩编码中的一项关键技术。由于视频编码系统的复杂性主要取决于运动估计算法,因此如何找到一种可靠、快速、性能优良的运动估计算法一直是视频压缩编码的研究热点。运动估计在视频编码器中承担的运算量最大、控制最为复杂,由于对视频编码的实时性要求,因此运动估计模块一般都采用硬件来设计...
效率,对于对频谱利用率要求十分苛刻的无线通信非常不利;后者的估计精度要差一些,跟踪范围比较小,而且计算复杂度较高。基于判决数据的同步跟踪算法由于具有不降低频谱利用率且算法复杂度较低的优点受到了广泛关注[5-6]。然而,该算法的性能好坏主要由判决数据决定,而判决数据又受到信道估计结果的严重影响。同时,信道估计性能的好坏也与同步性能密切相关[7],因此,将同步算法与信道估计算法相结合,能取得更好的估计...
H_264的快速运动估计算法 ISSN
清华大学学报 ( 自然科学版) 2005 年 第 45 卷 第 4 期   CN 1122223 N . 45, N o. 4 J T singhua U n iv ( Sci & T ech ) , 2005, V o l18 36 5012504面向 H. 264 的快速运动估计算法杨 鹏,  吴...
低信噪比下的高精度DOA估计是信号处理中的一个难点,传统的DOA测量方法和现代空间谱估计算法只适用于高信噪比环境。该文将传统的振幅测向法、数字多波束形成和FFT相结合,提出了一种基于频域处理的振幅测向算法,仿真实验表明该算法在信噪比为0~−25 dB的噪声环境中可以进行高精度DOA估计。关 键 词 DOA估计; 多波束形成; 快速傅里叶变换; 低信噪比; 无源雷达传统的有源雷达...
,必须选用FPGA设计FFT模块。 (3)在分析常规的插值算法基础上,提出了一种单信号的快速插值频率估计方法,只需三个FFT变换系数的实部构造频率修正项,计算量低。该方法具有精度高、测频速率快的特点。 (4)基于DFT理论和自相关理论,提出了结合FFT和自相关的双信号频率估计算法。该方法先用DFT估计其中一个信号的频率和幅度,以此频率对信号解调并对消该频率成分,最后利用自相关理论估计出另一个信号的频率...
学者针对H. 264 标准中运动估计的新特点进行了研究,其中有Xu J ianfen 等人[1 ]提出基于UMHexagonS 的快速运动估计算法; Tourapis 等[2 ]提出Ext EPZS 和双模式搜索算法。这些算法相对于全搜索算法而言,减少了运动估计过程中需要搜索的匹配点数,以牺牲重建图像质量和增加编码码率来换取计算复杂度的降低。全搜索算法虽然计算复杂大,但它适合于硬件实现,而且能够...
研究了基于非数据辅助的直接判决引导频偏估计算法和开放环频偏估计方法。研究结果表明,直接判决引导频偏估计算法复杂度较低,适用于对性能要求不高的系统。开放环频偏估计算法计算简单,其复杂度低于直接判决引导频偏估计算法,估计时间短适合突发通信系统。...
硬件系统的研究现状,并介绍了本文的主要工作。 @@ 接着对H.264编码标准的理论知识、关键技术分别进行了介绍。 @@ 对H.264块匹配运动估计算法进行研究,对经典的块匹配运动估计算法通过对比分析,三步、二维等算法在搜索效率上优于全搜索算法,而全搜索算法在数据流的规则性和均匀性有着自己的优越性。 @@ 针对块匹配运动估计全搜索算法的VLSI结构的特点,提出改进的块匹配运动估计全搜索算法。本文...
估计算法相关帖子
周期形成的,需要有复杂的间距估计算法。在语音帧内利用FFT,用估计的噪声幅值频谱相减,并逆变换这个相减后的频谱幅值,再利用原始噪音的相位,求出有噪音短时幅值和相位频谱。增强步骤一帧接一帧地完成。此方法先把污染的语音利用带通滤波器组分解成不同的频率组,随后每个分波段的噪声功率在无语音期间被估计出来。通过利用衰减因子可以获得噪声抑制,其中衰减因子相对应于每个分波段估计噪声功率比上的瞬时信号功率...
一个周期形成的,需要有复杂的间距估计算法。在语音帧内利用FFT,用估计的噪声幅值频谱相减,并逆变换这个相减后的频谱幅值,再利用原始噪音的相位,求出有噪音短时幅值和相位频谱。增强步骤一帧接一帧地完成。此方法先把污染的语音利用带通滤波器组分解成不同的频率组,随后每个分波段的噪声功率在无语音期间被估计出来。通过利用衰减因子可以获得噪声抑制,其中衰减因子相对应于每个分波段估计噪声功率比上的瞬时信号功率...
运动估计算法,并引入人体关节生理限制,可以准确地估计人体下肢运动,并实现人体在不同步态模式下在大地坐标系下的位移估计。利用微型惯性传感器和无线通信系统,高效地对患者下肢的运动进行捕获。过对下肢运动准确的分析,获知人体动态且全面的步态参数信息,包括时间、空间参数,运动参数。可以说是首次实现了评估和训练一体化。 步态分析是研究步行规律的检查方法,通过生物力学和运动学手段,揭示步态异常的关键环节和影响因素...
本帖最后由 ninglu 于
18:07 编辑
因工作需要拟招聘科研人员若干名,待遇从优,应具有研究生及以上学历
图像处理算法工程师 岗位职责目标检测与跟踪、图像分割算法研究与开发三维重建与姿态估计算法研究与开发 技能要求掌握机器学习与深度学习常用算法熟悉caffe、tensorflow、mxnet等具备熟练的英文文献阅读能力掌握C++、python编程技能
,测量更新方程可视为校正方程。最后的估计算法成为一种具有数值解的预估-校正算法,如图1-1所示。
卡尔曼滤波器介绍(中文)...
; ♦&&SOC估计算法验证耗时长,真实的电池组充放电试验耗时一周甚至更长的时间;
& && & ♦&&模拟特定工况难度大,例如均衡功能测试时,制造电池单体间细微SOC差别,电池热平衡测试时,制造单体和电池包间细微的温度差别等;
& && & &#9830...
人用来做平面或者立体的雕刻的,也就是做成雕刻机的功能,我的想法不是代替雕刻机,而是在想这个结构无论是那一个电机在动,都会导致立体上的位置变化,而不是单单平面上的变化,所以做3D打印要求没有那么大,但做雕刻,估计算法或速度就很有要求。
fsyicheng 发表于
这两天看你的文章,特然有一个疑问,这个三角洲的结构,有没有人用来做平面或者立体的雕刻的,也就是做成雕...
不多说了,谢谢ADI,EEWorld和版主,上图了:
想好了,准备春节回家在火车上玩。。。
收到了ADI的魔方了,外观很精致很赞哦 楼主有的玩了啊&&不要忘记下火车啊
拿lego做个解魔方机器人
哈哈,二楼真幽默啊。
三楼的这个解魔方机器人挺牛逼的,估计算法很复杂吧。
哎,楼主到手的真好,我的到手后碎了一地,今搞了一个小时,才粘好,
毕业设计做的LTE下行链路信道估计算法研究 自己顶一个,真心求助
我要丧命了
都毕业了还贴一大堆的代码
基本是没人回答的.......
492.TD-SCDMA通信技术革新性研究
493.基于VHDL的脉冲编码调制(PCM)仿真
光纤自动监测系统的设计
494.从GSM过渡到TD-SCDMA的策略研究
495.基于GSM远程视频监控系统的设计
496.基于ZIGBEE技术的无线抄表系统的设计
497.移动通信系统频率分配算法和技术的研究
498.基于GSM短信模块的家庭防盗报警系统
499.移动环境下的信道估计算法研究
500.移动...
估计算法视频
你可能感兴趣的标签
热门资源推荐实名学术社交
个性化订阅推荐
快速查看收藏过的文献豆丁微信公众号
君,已阅读到文档的结尾了呢~~
基于静态足底压力特征的步态识别算法研究,足底压力步态分析系统,六足机器人 步态算法,静态优先级调度算法,静态聚类算法,静态路由选择算法,静态调度算法,静态优先级算法,静态路由算法,静态负载均衡算法
扫扫二维码,随身浏览文档
手机或平板扫扫即可继续访问
基于静态足底压力特征的步态识别算法研究
举报该文档为侵权文档。
举报该文档含有违规或不良信息。
反馈该文档无法正常浏览。
举报该文档为重复文档。
推荐理由:
将文档分享至:
分享完整地址
文档地址:
粘贴到BBS或博客
flash地址:
支持嵌入FLASH地址的网站使用
html代码:
&embed src='http://www.docin.com/DocinViewer--144.swf' width='100%' height='600' type=application/x-shockwave-flash ALLOWFULLSCREEN='true' ALLOWSCRIPTACCESS='always'&&/embed&
450px*300px480px*400px650px*490px
支持嵌入HTML代码的网站使用
您的内容已经提交成功
您所提交的内容需要审核后才能发布,请您等待!
3秒自动关闭窗口1688.com,阿里巴巴打造的全球最大的采购批发平台
1688/淘宝会员(仅限会员名)请在此登录
cbulogin.center.eu13Server is OK当前位置: >>
基于视频的步态识别
中国科学院计算技术研究所 博士学位论文 基于视频的步态识别 姓名:赵国英 申请学位级别:博士 专业:计算机应用技术 指导教师:李华
革千视频的步态识别:确耍摘要在智能环境研究中。人体运动分析与生物特征识别相结合目前已经成为一个流行的研究方向.步态识别,非接触式远距离的身份识别研究一一基于运动视觉的第二代生物特征识别技术,是根据拍摄的行走视频,通过人体走路的方 式辨别人体身份。和其它生物特征相比,无需接触和干扰,不具有侵犯性,其 信息可以在相对较远的距离秘密地得到并进行识别。本文从理论和实际应用的 角度,对以视频为输入的步态识别进行了一些新的探索.本文的主要贡献如下: 1)提出了幅值谱和反射对称作为关键帧特征的步态识别算法.分别利用了步态图像在频域上的特征和心理学研究中步态的对称性对步态进行分析.幅值 谱反映了人体步态的频域特征,而反射对称隐含表示了行走时人体的胳膊和身体的摆动习惯.反射对称性虽然不是唯一的特征,但实验证明反射对称是人体 运动的特征之一,可以辅助进行识别.其优点是计算简单、快速,特征直观、 有效. 2)提出了小波速度矩和小波反射对称矩,以及用二者的结合来描述步态,进行步态识别.小波矩将小波特性和矩特征结合在一起,是一种新的矩特征,不仅具有平移,缩放和旋转不变性,而且具有小波分析的局部性,较强的抗噪性和多分辨率特征,很好地避免了高阶几何矩的计算,同时大大加强了矩特征对图像结构精细特征的刻划能力.在相似信号的识别中表现出很好的特性.速 度描述了行走时的动态特征,反射对称隐含了身体的倾斜和手脚的摆动.文中 将速度特征和反射对称特征分别和小波矩相结合,获得小波速度矩和小波反射 对称矩.实验结果表明,算法得到了较好的识别结果,并具有一定的遮挡处理 和抗噪性。 3)提出了分形维数小波分析描述子步态识别算法,并利用训练信号。得到优化滤波器,提取特征,进行识别,改进识别结果.在小波矩计算中,只应用 了那些能够显式表达的小波函数,并没有应用Mallat算法,从而限制了小波 矩的广泛应用.本文将计算机小波和Ma!lat算法融入了小波矩的计算,并通过小波分析的方法求解分形指数,它增加了小波矩的灵活性,保留了小波矩描述子的性质,充分利用二维图像序列不同尺度上小波分析系数的自相似性,同时减少了计算复杂度.为得到针对不同数据的优化滤波器,文中算法通过学习 IlI练信号,得到广义M进制多尺度滤波器,使得重构信号对原始信号达到最佳 逼近.最后,通过最优滤波器提取特征,进行模式分析,在一定程度上提高了 识别率?同时,对我们的算法和国内外的主要算法在计算时间、等错误率、复 蕈f.税频的步卷识别:摘要杂数据的识别以及步态速度变化处理等方面做了比较.分形维数描述子具有最 低的等错误率和最少的计算时间.丽小波矩和分形维数描述子的结合得到了最 高的识别率. 4)基于多摄像机视频跟踪,提出了一种静态特征和动态特征相结合的三维 步态识别方法.在复杂场景中。人体在运动中,经常存在视点变化、遮挡、地 面变化等,而二维分析难以解决.本文在运动检索和多摄像机视频跟踪的基础 上.提取人体肢段长度作为静态特征,下肢关节相对于根节点的距离运动作为 特征.利用线性时问归一化束进行序列匹配和识别.三维方法在更为复杂的 3D空问描述人体模型和运动模型,可以解决视点,光照变化和遮挡问题,并且在二维分析难以解决的较为复杂的地面变化实验中取得了较好的结果.,;f、关键词:视频,步态识别,反射对称,小波速度矩,小波反射对称矩,分形维致,多摄像机跟踪,三维步态识别Ⅱ Video?based Gait Recognition GuoyingZhao(ComputerApplicationTechnology)Directed By Hua Li In ambient intelligence,the combinationaof humanmotionanalysisandbiometrics has beenprevalent researchonfield.Gait recognition,the second motion vision,is used tO signify thebiometrics identification technology basedidentity of individuals in image sequences‘by the way they walk’.Compared with }{other biometrics,such requiretOasfingerprint,face and iris,gait is unobtrusive and does not gait recognition may be performedatacontact,SOdistance~surreptitiously.This thesis,in both the theoretical and the practical perspective, probes into gait recognition with the videosasinput.The main contributions oftllis thesisaresummarizedaasfollows:1)Proposedkey framesasmethod using amplitude spectrum and reflective symmetry oftogait featuresrecognize domaintestsequence.Amplitude psychologicalarespectrumwhich(Fourierspectrum)of frequencyaandstudiessuggested that gait issymmetrical pattern of motionapplied tO analyse gait.Amplitude spectrum describes the frequency feature of gait image and reflectivesymmetry implicitlyExperimentsonrepresents the habit with which person’S leg and body swings.rateUSF dataset show that recognitionusing symmetry featurewith frequency feature and proportion of body is higher.than only exploiting thefrequency feature and the proportion.Reflective symmetry isuseful feature and itcannot a unique but a tobe easily combined with other featuresimprove therecognition rate.Proposed algorithm is simple to implement and insensitive to thechanges of walking speed,background,andSO on.2)Developedmoments andnew wavelet velocity moments,wavelet reflective symmetry wavelet and velocity moments and reflectivecombinedtOsymmetryarefeaturestogetherdescriberecognize gait.Wavelet momentsnewmoment features which combine the characteristics of wavelet and moment.So、t,they have the features of moments:translation,scale and rotation invariance,and the trait of wavelet withanalysis(stronglyanti-noise performance and local analysis avoid the computationcanmulti-resolution).Wavelet momentsof high ordergeometric moments and,at the same timestrengthen the analysis ability tosubtle image feature,thus showing good performance in classifying similar imageobjectswith subtledifferences.Becausepeoplearewalking,velocityisanimportant feature tO be used to discriminate them,reflective symmetry implicitly represents the habit with which person’S leg and bodyswings.Waveletcombinedvelocityaremoments,waveletreflectivesymmetry11Imomentsandireatures V?dco.basod Gaff Rcc,ognmon‘Abstractproposed by integrating the velocity and reflective symmetry feature with wavelet moments.These features describe the appearance and motion of people.Experiments show that these algorithms achieved good results and noise and occlusion to some degree.candeal with3)Proposedrecognizefractalscale wavelet analysis wavelets achieved bytodescribeandautomatically thegait.Optimaltrainingsignals,promoterecognition rate.In the expression of wavelet moments,only the wavelet function with explicit continuous expressioncanbe used,andMallatalgorithm does notf;一.applied,which limits the wide application of wavelet moments.We improved thepresent waveletdescriptor,introducedthecomputerwaveletsandMallatdecomposition algorithm,and solved the fractal scale using wavelet analysis.The new fractal scale descriptors improved the flexibility of wavelet moments,kept the characteristics of wavelet moments,reduced the time complexity,at the same time。made used of the self-similarity of gait signals.To get the optimal filters,wefirstly selected some gait sequences to extract the signals randomly,then used these signalstotrainoptimaltowavelets fractaland scalelastlyapplliedgeneralizedcanmulti?resolution analysisrecognition resultstoextractfeatures.This ofourpromote withrate,somedegree.Comparisonalgorithmserrorinternational algorithms in many aspects,such as time consuming,equalrecognition results in complex data,gait velocity handling,showed that fractal scale descriptors achieved the lowest Equal Error Rate(ERR)and computation complexity,andcombination of wavelet momentsfeaturesandfractalscalefeatures got the best recognition results.4)Basedcombined theonmulti-camera tracking,we proposed 3D gait recognition,whichhuman parameters and dynamic features,matched andstaticrecognized sequences according to the time normalization.For human motion incomplex environment,images changes resulting from view change,occlusion andground changecases,onwould make the 2D analysis incorrect andinaecurate.In thesethe basis of motion retrieval and multi?camera tracking,segments lengthasis extracted limbstostatic parameters and the distances between keyarejointsof lower timemid-hip jointtoextractedasdynamicfeatures.Thenlinearnormalization is usedmatch and recognize gait.This method described thehuman model and motion features in more complex 39.space,and was capable of dealing with view,light change,and handling occlusion.Good results wereachieved in experiments with variant ground which is very difficult to be handled_●■1,{ Video-based Gaa Recogmtton:Abstractin 2D analysis. Keywords:video,gait moments,wavelet recognition,reflective symmetry,wavelet velocityreflective symmetry moments,fractalscale,multi-camerastracking,3D gait recognitionV 声明我声明本论文是我本人在导师指导下进行的研究工作及取得的 研究成果。尽我所知,除了文中特别加以标注和致谢的地方外,本论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作lP的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表 示了谢意。作者签名:走目夹日期:缈i身硐,田论文版权使用授权书本人授权中国科学院计算技术研究所可以保留并向国家有关部 门或机构送交本论文的复印件和电子文档,允许本论文被查阅和借 阅,可以将本论文的全部或部分内容编入有关数据库进行检索,可 以采用影印、缩印或扫描等复制手段保存、汇编本论文。’,j(保密论文在解密后适用本授权书。)作者签名:灸闻族导师签名:参寺日期:渺s红4翻旧 箱一市结论第一章绪论1.1研究背景和意义 在交互技术研究中,人体姿态是一种前于语言、文字表述的文化传达方式,比有声语言有着更为久远的历史。日常生活中,人们常用不同的姿态表示主观感受和意愿,如舞台艺术或电影艺术等.直立行走是人类的特征,步态是人体姿态的一种,姿态或者步 态研究的科学根据是不同的姿态具有不同的语义特征.即使儿童也能够从背影中识别自己的亲人,表明了这一点。人体运动分析与生物特征识别相结合的视觉监控目前已经成为一个重要的研究方 向.虽然指纹、人脸等生物特征在安全领域已经开展了广泛的研究并有了初步应用,但 这些生物特征的获取需要近距离接触,且得到的图像要求是高分辨率,而且人脸通常要 求是正面图像.这些都限制了其应用范围.在许多特定的颁域中,这些特征都难以获得, 且容易伪装或隐藏.因此,步态是一种可选的新的生物特征。步态是后天形成的行为特 征.步态识别根据拍摄的行走视频。通过人体走路的方式辨别人体身份.和其它生物特 征相比,步态不具有侵犯性,其信息可以在相对较远的距离得到。从监督应用的角度看, 步态是一种非常具有吸引力的特征,因为其信息可以在远距离秘密地获得并进行识别。 其优点如下:一、不具有侵犯性,不需要身体接触;二、难以伪装和隐藏;三、可以在 低分辨率图像序列中检测和识别;四、唯一一个远距离识别的生物特征.最近,医学, 心理学和计算机视觉的联合研究都表明了步态信息的重要性以及作为生物特征识别的 潜在性.精神物理学研究表明[Cutting 1977]:人类有能力从即使观察环境很差的步态中 识别身份,这说明步态信息中存在着个体信息.人体步态由许多因素决定,包括体格、 体重、鞋子高度、地面状态、衣着和精神状态等.但是由于人们经常改变衣着、行走速 度,以及摄像机拍摄角度的差异,使得步态识别成为一个具有挑战性的课题。其目标是 无论背景、光照、衣着,速度等如何变化,都能正确识别身份。而心理学研究表明,步 态运动是对称的[Cutting1978,Tabb2000],也为步态分析提供了理论支持。这种非接触Researcha式远距离的身份识别研究――基于运动视觉的第二代生物特征识别技术,近来倍受关注.美国高级研究项目署DARPA(DefenseAdvancedProjectsAgency)在2000年资助的重大项目――mD计划(HumanIdentification atDistance),其任务就是开发多模式的监控技术以实现远距离情况下人体检测、分类和识别,从而增强国防,民用等 场合免受恐怖袭击的保护能力.近距离时一般可通过跟踪人脸来加以身份识别(但人脸 可以隐藏);如果是远距离的监控,脸部特征可能被隐藏,或者分辨率太低不易识别, 然而进入监控领域的人体步态是可见的,这使得步态作为一个独特的生物行为特征应用 于人体身份鉴别。乔治亚理工学院等26家高校或公司参与研究.在国际学术会议AVBPA(Audio?and Video-basedBiometric PersonAuthentication)’01.’03和FG(IEEE 中固科学院博I‘学位论文――茌-F桃频的步态识剐International Conference onAutomatic Face and GestureRecognition)’02,’04均出现了关于步态的专题报告(oral session).从视觉监控的观点来看,步态是远距离情况下最有潜力 的生物特征。从而引起了广大研究者们的浓厚兴趣(参见下面关于论文的年发表量统计图).圈1.1步态相关论文统计Figure I.I Statistic ofpapers about gait本文以视频序列为输入,研究在视频人体运动分析基础上进行步态识别的技术,可 用于智能环境监控等,其分析方法可以扩展到其它动作和应用领域,如临床诊断、高级 人机交互、体育运动的仿真和指导中,具有理论研究价值和现实的应用意义.1.2研究方法和技术路线 步态识别方法可以分为三类:二维步态识别、三维步态识别、以及二维和三维的结合.二维步态识别就是在单摄像机拍摄的单目视频中通过轮廓提取低层信息来进行分析 和识别,又可以分为基于外观的方法和基于模型的方法.二维低分辨率视频识别多是采 用基于外观的方法.这种方法对视频质量要求不高,算法简单,易于实现,但必须考虑 视点,鞋子,光照等条件。二维高分辨率视频识别多是采用基于模型的方法,其要求视 频分辨率高,模型匹配及跟踪比较复杂,而且对于视点以及其它条件不具有不变性.二 维方法的主要缺陷是其对于摄像机角度的限制以及遮挡问题。 三维步态识别是在两个或两个以上摄像机拍摄的多视频中根据三维模型进行跟踪, 恢复底层的三维人体结构,提取步态动态特征,进行分析或识别。三维方法的优点是: 对于视点,光照等不敏感,能处理遮挡;缺点是系统复杂,要求应用多摄像机,对于衣 服变化难以处理。而且要以三维人体运动跟踪为基础,而目前三维跟踪仍处于起步阶段, 仍有许多难点,如自动初始化、有效的高维空间搜索,自适应多特征融合等问题。三维 步态特征的描述和提取也是一个难点.目前尚无完整的三维步态分析方法。 二维和三维方法的结合就是将二维图像中的轮廓特征和三维人体运动中获得的基 本运动信息相结合,二维特征简单,实用性强,三维特征可以解决视点等的变化。2 第一帝绪论一个或多个步态序列匡圃一囝囹气?莓-圉 国\阑 、旦④酝圆扣慝jj、t一一,图10步态分析系统Figure 1.2 Gait analysis system步态分析涉及到人体步态运动分割、步态运动跟踪、特征提取和识别四个主要步骤, 其系统如图1.2所示.其特征和分析方法也可以迸一步推广到步态行为理解领域。 步态识别研究的难点在于如何描述、提取和分析步态所包含的信息.从特征提取的 角度,就是如何描述和提取有效的鉴别特征.从方法论上讲,就是如何对这些特征加以 定义、分析、综合和归类处理。 采用二维分析方法还是三维分析方法,很大程度上取决于具体应用.对于那些没有 必要或由于条件限制而无法获得精确姿势的应用,二维方法将非常有效。对于各种没有 限制的复杂环境人体运动,和需要获得高层次人体分析的应用中,三维方法更加有意义。 因为最终解决视点变化及遮挡问题必须依靠三维,所以也要以三维跟踪为基础,提取全 身关节运动作为特征,进行分析。通过生成模型,进行仿真,并最终进行步态识别等。 因此考虑到不同的应用,我们的研究并没有简单地抛弃某种方法,而是在二维和三维上 分别展开,为不同的环境和应用提供不同的解决方法.1.3本文内容1.3.1研究目的 由于步态是一种时空变化的运动模式,因此它的数据处理量相对较大.像其它生物 特征一样,步态也受视点,衣着,遮挡以及一些诸如醉酒、怀孕、关节受伤等物理因素 的影响.步态识别是一个相当新的研究领域,非常具有挑战性.耳前已涌现出一些尝试 性的工作。但仍需要强调的是,步态识别研究目前仍处于初级阶段。 中田}I学院博I。学他论丈一毕干锐颏的步态识帮本研究的总体目标是以单个或多个视频序列为输入,通过人体检测,在图像中分割 运动人体,在图像序列中跟踪步态运动,提取二维特征或恢复底层的三维人体结构,提 取步态特征,用于背景、光照、衣着、祝点等变化具有较强鲁棒性的身份识剔,并尝试 推广到运动性能的分析、辅助临床治疗等领域。 1.3.2本文的贡献 考虑到不同环境的应用,针对目前的研究现状,本文的研究在二维和三维上分别展开。主要贡献是:1)基于幅值谱和反射对称的时空模板步态识别方法 我们提出了幅值谱做为关键帧特征识别步态,并在心理学关于步态对称性的基础 上,提出了反射对称描述子.幅值谱反映了人体步态的频域特征,而反射对称描述子隐 含表示了行走时人体的胳膊和身体的摆动习惯.根据关键帧分析步态图像特征,计算简 单.而且不受行走速度的影响.利用过重心的主轴线计算反射对称,是一种快速有效的 方法,反射对称特征符合心理学研究,而且有助于步态识别。 2)基于形状检索的运动分类和仿真系统 运动识别和模拟是人体运动分析中重要的研究内容.我们实现了以检索为基础的实 验性的运动分析系统.小波矩具有平移、旋转和缩放不变性,能够提取局部多层次特征, 被用作特征来描述运动序列以及动作.本文根据相似性实现运动识别,利用动态时间变 形(DynamicTuneWarping,DTW)实现序列的动作匹配,在poser软件建模、依据正多面体分割的金字塔模型得到多视点投影视频的数据库中进行识别和匹配,并以三维模 型的形式显示出来.实验结果可以模拟人体运动,或者为进一步分析提供初始分析数据。 3)基于小波速度矩和反射对称的步态识别方法 二维小波矩是一种新型有效的形状描述子,在此基础上,引入速度特征和身体的反 射对称特征,提出了小波速度矩和反射对称矩,做为描述子分析步态,并将小波速度矩 和反射对称特征结合起来,提高识剔率. 4)分形维数小波分析步态描述子 在小波矩分析的基础上,我们改进了已有的二维小波矩描述子。将计算机小波和 Mallat算法融入了小波矩的计算,并通过小波分析的方法求解分形指数,提出了一种新 型的分形指数描述子。从而可以引入多种小波,并以多尺度的小波分析系数之间的自相 似性做为特征,进行步态识别。该算法的优点是保留了小波矩描述子的性质,提高小波 矩的计算速度,同时减少了计算复杂度.并且,通过对训练信号的学习,得到广义M 进制多尺度滤波器,使得重构信号对原始信号达到最佳逼近,以优化滤波器分析,提高 识别结果。 在特征计算时间、等错误率、识别率,步态速度处理等方面对本文中的算法和国外 算法进行了比较。4 筇一帝缔论5)多摄像机步态仿真基于二维单摄像机图像轮廓的识别容易受到混乱背景、自遮挡以及视点变化的影 响。因此,我们根据多摄像机图像去除二维到三维的歧义问题,建立三维模型,在跟踪 的基础上得到步态特征,提取肢段长度作为静态特征,下肢关节与根节点相对距离运动 轨迹作为动态特征,利用线性时间归一化来进行序列匹配,进行识别.三维方法在更为 复杂的3D空间描述人体模型和运动模型,可以解决视点、光照变化和遮挡问题,并且 在=维分析难以解决的较为复杂的地面变化实验中取得了较好的结果。1.4本文内容组织 第一章(本章)主要介绍本文工作的背景以及本文的贡献. 第二章介绍步态识别的背景知识,主要是步态的特点、识别问题的挑战性、当前的分析方法和常用数据库. 第三章介绍步态分析的背景知识:人体运动分析领域的主要研究成果和存在的主要问题.从第四章到第七章依次介绍本文的主要工作,包括基于二维图像的幅值谱和反射对 称的时空模板识别方法、小波速度矩描述子描述步态、小波速度矩和反射对称的结合改 进识别、改进的分形维数小波分析步态描述子和基于三维人体模型的静态和动态特征结 合的识别方法。 第八章回顾本文所讨论的内容,并对将来的工作提出一些设想。 籀-二帝步态识剐概述和步态数据库第二章步态识别概述和步态数据库2.1步态识别的基本任务基于视觉的人体运动分析最有前景的潜在应用之一是视觉监控.智能监控系统的需 求主要来自那些对安全要求敏感的场合,如银行、商店、停车场、军事基地等.动态场 景的视觉监控是从摄像机摄取的图像序列中检测,识别、跟踪目标并对其行为进行理解。 区别于传统意义上的监控系统,这里所说的视觉监控在于其智能性.简单而言,不仅用 摄像机代替人眼,而且用计算机代替人、协助人,来完成监视或控制任务. 正是由于智能房间的门禁系统、军事安全基地的视觉监控系统,高级人机交互等应 用需求,基于运动视觉的生物特征分析技术研究日益显得迫切和重要.例如,在人机交 互中不仅需要机器能知道人是否存在、人的位置和行为,而且还需要利用特征识别技术 来识别与其交流的人是谁.人体运动分析与生物特征识别相结合的视觉监控目前已经成 为一个流行的研究方向。 生物特征Biometries[Cuntoor2003,Kale 2004]。如图2.1所示,是一种以人体的生 理,行为特征为基础的身份识别方法,由于其通用性和唯一性,在身份识别中起到了越来、 越重要的作用.生物特征分为两种:生理特征和行为特征.生理特征与生俱来,多为先 天性的,如虹膜、指纹、脸像、手形等:行为特征则是习惯使然,是后天形成的,如笔 迹、步态等。指纹和手形已经研究了许多年,技术可靠,但需要身体接触.脸部识别系 统在高分辨率正面图像采集,且光照条件较好时,性能很好.当前,虹膜识别系统仅在 相对非常近的距离内才能有效识别.但是在许多应用中,尤其是监督应用或类似于银行 抢劫之类的应用中,嫌疑人可以带面罩,面部可能整过容,有经验的罪犯不会留下指纹, 而且拍摄距离较远。很难获得可用的指纹、脸部或虹膜信息陬ale 20031。这类情况下,一种很好的选择是步杰。螽留墙,铂娘舅犯设%c蟊畚砟_棚融话膏信号哆l錾黟荠?薯{耐 》穗,台冬不嚣,handwriting)豳2.1生物特征(人脸、指纹、虹膜、语音和笔迹)Figure 2.1 Biometrics(Face。fingerprint,ids,voice/speech and1)步态的特点 步态识别根据拍摄的行走视频,通过人体走路的方式辨别人体身份[BenAbdelkader 2002a].和其它生物特征相比,步态不具有侵犯性,其信息可以在相对较远的距离得到。 从监督应用的角度看,步态是一种非常具有吸引力的特征,因为其信息可以在远距离秘6 中国科学院博II学位论好――堆f税频的步态识别密地获得并进行识别.步态的优点:一、不具有侵犯性,不需要身体接触;二、难以伪 装和隐藏:三、可以在低分辨率图像序列中检测和识别;四、唯一一个远距离识别的生物特征. Oxford词典上gait的定义是[Nixon 1999]:“manner ofwalking。beatingone orcarriageaswalks”,其研究可以集中在人体行走的不同方面.步态可以用束识别人体身份,虽然其研究近些年才广泛开展,但该观点并不新颖[Nixon 1999】:Shakespeare在(The Tempest)的第四幕第一场,Ceres有一句台词。great Junocomes,Iknowherbyhergait”, 这表明他认为步态对于一个人来说是唯一的,而且是可识别的。 2)步态作为生物特征的理论基础和实际需求 最近,医学,心理学和计算机视觉的联合研究都表明了步态信息的重要性以及作为 生物特征识别的潜在性.精神物理学研究表N[Cutting 1977]:人类有能力从即使观察环 境很差的步态中识别身份,这说明步态信息中存在着个体信息。人体步态由许多因素决 定。包括体格、体重、鞋子高度、地面状态、衣着和精神状态等.由于人们经常改变衣 着、行走速度,以及摄像机拍摄角度的差异,使得步态识别成为一个具有挑战性的课题. 其目标是无论背景、光照、衣着、速度等如何变化,都能正确识别身份.而心理学研究 表明,步态运动是对称的[Cutting1978,Tabb20001,也为步态分析提供了理论支持。安全敏感性领域有此需求,而且步态数据获取所需的摄像机使用非常普遍和方便, 也为步态的应用研究打下了基础.因此,这种非接触式远距离的身份识别研究――基于 运动视觉的第二代生物特征识别技术,近来备受关注.美国高级研究项目署DARPA(Defense Advanced Research (Human Identificationat aProjects Agency)2000年资助的重大项目――HID计划Distance),其任务就是开发多模式的监控技术以实现远距离情况下人体检测、分类和识别,从而增强国防、民用等场合免受恐怖袭击的保护能力. 3)步态识别的推广应用 传统的步态分析是肌电图学、关节动力学的研究范畴,现在其应用可推广到多个方面:1.在智能监督系统中,作为生物特征识别身份或分辨性别,作为法律工具辅助破案。 2.临床诊断和治疗.目前的医学步态分析[K6hle1997,Lakany1999,Meyer 19971是一个旨在提供诊断和治疗支持的研究领域,它可以提供人体正常步态建模的线索,有 助于开发生物反馈系统来分析病人的步态,判断其腿部受伤情况或者畸形程度,从而做 出积极的整形补偿或有效的治疗。 K6hleMerkl和Kastner利用地面反作用力测量平台来做步态分析辅助腿部畸形的诊 断和治疗[K6hle 1997],使用测量的原始数据和人工神经网络判断步态障碍。通过监督 学习规则,学习向量量化来进行分类. 3.游戏和动画中人体的动作.4.在高级人机交互中,需要的是不仅使机器感觉劐人的存在、位置和行为,还应该通过生物特征识别知道用户的身份.7 第一帝步态识别概述和步态教粥库5.其分析方法可以推广到其它动作和行为,可应用于体育运动,舞蹈等训练中。 一般认为。步态分析研究涉及四个领域:运动学(kinematics),动力学(kinetics),肌电图学(elcctromyography).和工程数学(engineering mathematics)fWhittle 1996]。Kinematics是运动的测度.最早的人体行走的kinematic研究是Marcy在19世纪70年代在巴黎和加州的Muybridge开展的[Whittie 1996]。这些早期研究使用静态摄像机。在电影摄影术发展之后,精确度有了很大改进。也成为迄今为止kinematic测量的主要方 法.Kinetic测度很大程度上受到地面和脚之问作用力的影响,使用放置在地面上的测力 台测量.现在的步态分析系统,根据运动学和测力台数据,使用工程数学为基础,以关 节运动和关节力的形式提供了附加的动力学信息。肌肉电子运动测度 (Elcctromyography。EMG),是在二十世纪上半叶开发的。第一个在走路过程中的EMG 研究是由加州的研究者在40年代和50年代完成的[Inman 19811。工程数学的第一个重 要应用是19世纪90年代开展的步态研究.该方法在20世纪30年代由莫斯科的Bernstein 和50年代加州小组进~步研究[Whittle 1996].60年代以后。在不同关节之间的力和力 矩的传递,以及行走中能量使用和保留的方式方面做了大量重要的研究.今天,大部分 步态分析包括使用反向动力学(inversedynamics)来计算关节矩和力,使用运动学系统 的肢体运动和测力台的地面反应力作为输入数据. 步态分析可以在不同应用上实现,例如:作为生物特征识别人体或分辨性别,或者 检测行走中的畸形(桩床应用).下面详细介绍步态作为生物特征来进行识别.步态通 过大量研究,目的是训练系统来识别步态特征.训练是以收集图像数据,利用统计工具 来提取步态特征,或者存储人体步态的模板或模型来匹配为基础的。统计分析包括使用 从特征空间得到的特征,时空信息,时间序列和轮廓.基于模型的方法包括使用隐马尔 可夫模型(Hidden 型和运动模型。 美国高级研究项目署DARPA在2000年资助的重大项目――HID计划,其任务就 是开发多模式的监控技术以实现远距离情况下人的检测、分类和识别,从而增强国防、 民用等场合免受恐怖袭击的保护能力.近距离时一般可通过跟踪人脸来加以身份识别; 如果是远距离的监控,脸部特征可能被隐藏,或者分辨率太低不易识别,然而进入监控 领域的人体步态是可见的,这使得步态作为一个独特的生物行为特征应用于人的身份鉴 别.乔治亚理工学院(GeorgiaInstitute of of MarkovModel。HMM),动态轮廓线,骨架模型,纸板(cardboard)模Technology)、马里兰大学(UniversityMaryland,UM),卡内基梅隆大学(Carnegie Mellon University,CMU)、南佛罗里达州大学(University ofSouth Florida。USF)、南安普敦大学(University ofSouthampton)和麻省理工学院(The MassachusettsInstitute ofTechnology,MIT)等26家高校或公司参与了该项目的研究工作,其目前焦点在于脸像、步态或者特定行为的识别. 国内中科院自动化所也开展了“人的步态分析与识别”项目研究,北京科技大学信 息工程学院也开始了相关的研究.’步态识别方法可以分为三类:二维步态识别、三维步态识别、以及二维和三维的结 中国}}学院博I,学位论文――苹十视频的步态识剐合.二维步态识别就是在单摄像机拍摄的单目视频中通过轮廓提取低层信息来进行分析 和识别;三维步态识别是在两个或两个以上摄像机拍摄的多视频中根掘三维模型进行跟 踪。恢复底层的三维人体结构,提取步态动态特征,进行分析或识别。2.2单摄像机二维步态识别 基于二维图像特征/外观的步态识别方法2.2.1该方法不需要先验模型,只要通过对图像序列中运动人体生成的时空模式做统计分 析,隐含定义应该观察的特征并以此来对步态进行特征提取和分析,常用于低分辨率图像序列。a)二维低分辨率(基于特征,外观的方法):时空模板 Ctmtoor,Kale和Chellappa研究了前视图和侧视图的动态特性[Cuntoor 2003],如手 臂/腿的摆动,上身摇动和静态特性如身高等特征,并把这些特征综合起来进行识别.其优点是改进了识别效果.Collins,Gross和Shi以人体轮廓的模板匹配为基础,提出一种基于视点的识别技术[coniIls 2002b],匹配从步态周期中提取的关键帧的二维轮廓。Collins,Liu和Tsin把步态运动的轮廓在水平及垂直方向上的投影宽度作为Frieze 模式来研究[Collins 2002a】。 Phillips,Sarkar和Robledo等人探讨了远距离步态识别的挑战性问题,并提出了baseline算法[Phillips 2002a,Phillips 2002b].Wang,Ning。Hu和Tan提出一种基于外观特征的方法[Wang 2002a】,轮廓随时问 的姿态变化在二维空间中的对应描述为一个序列的复数表示;利用Procrustes形状分析 方法所获得的主轮廓模型作为特征,结合标准的模式分类技术进行个体的步态识别。 韩鸿哲,王志良等对人体轮廓进行水平和垂直投影【韩鸿哲2003],将投影向量合并 在一起作为特征向量,应用主元分析方法(principalcomponentanalysis,PCA)对特征进行压缩,最后使用支持向量机(support vector machime:,SVM)进行识别。 Wang和Tan等[Wang 2003c]以基于主元分析方法,提出了一种有效的、不需模型 的二维步态识别算法。对于每个步态序列,利用改进的减背景技术提取人的空间轮廓; 然后将轮廓的边缘按逆时针方向展开为一系列相对于质心的距离模板:通过使用主元统 计分析方法来训练这些模板特征,从而得出步态形状的变化模式在特征空间中的轨迹表 达:识别时尝试了时空相关匹配方法和基于归一化欧氏距离的最近邻规则。同时,引入 了相应个人的体形等生理特征的融合,以用于必要的步态分类校验。Bobick和Johnson[Bobick2001,Johnson2001]提取走路中测得的静态身体参数和步幅参数为基础,如图2.2中dl,d2,d3,d4,来进行步态识别,该参数只能在人们做行走这 种特定动作时有效,因此称作“Activity specific”.?一 第一帝步态识别概述和步态数据库图2.2静态身体参数[BobickFigure 2.2 Static body2001,Johnson20011parameters[Bobick2001,Johnson2001】2002a,Kale 2003,Kale,Cuntoor和Rajagopala等采用基于外观和视点的方法[KaleKale2004】,以行走人体的二值化外轮廓宽度作为基本特征,使用动态时间变形(DTW) BenAbdelkader和Curler等提出了步态图像的自相似表(self-similarity来匹配,使用非线性时间归一化来处理行走速度的变化.plots)[BenAbdelkader 2001,BenAbdelkader 2002a]特征。该方法对于跟踪和分割误差以及衣着 和背景变化较鲁棒。 Hay丘on-Acquah,Nixon和Carter使用广义对称算子(GeneralisedSymmetryOperator)[Hayfron-Acquah2001]分析人体运动的对称性。对于噪声和丢帧较鲁棒,而且 能处理遮挡,但是无法处理视点变化。 b)基于矩的方法 在图像序列中,由于经常存在运动人体的平移和缩放,因此许多识别工作必须首先 消除这些变化。矩是一种处理平移、旋转和缩放变化的有效工具。在上世纪六十年代早 期,经典Hu矩就应用于二维图像处理中【}Iu 1962]。近几年来,矩也被应用于步态分析 和识别中. Little和Boyd使用基于矩的特征来刻画光流[Little 1998],识别步态. Lee和Grimson计算人体每部分模型的矩特征[Lee 2002a]:如重心、主轴等; Liu,Collins和Tsin利用二值图像的一阶矩和二阶矩来确定轮廓间粗略对齐的仿射 变换【lLiu 2002】。 Shurler和Nixon通过Zemike速度矩描述运动[Shurler 2001】。 但由于使用的Hu矩、Zemike矩等都以几何矩为基础,高阶矩计算困难,稳定性差, 因此都是只使用低阶矩进行描述和分析,难以刻画信号之间的细微特征。 二维低分辨率识别多是基于外观的方法,对视频质量要求不高,算法简单,易于实 现.但必须考虑视点,鞋子,光照等变化.0 中圆科学院博{学位论文――单十税频的步态识剐2.2.2基于模型的方法 基于模型的方法假定一个先验模型,把2D图像序列和模型做匹配,常用于高分辨率图像序列.Niyogi和Adelson利用时空切片方法进行人体跟踪【Ni),ogi 1994]。首先观察由人体 下肢轨迹所产生的时空交织模式,然后在时空域中定位头的运动投影,接下来识别其它关节的轨迹,最后利用这些关节轨迹勾画出一个行人的轮廓。使用勾画出的2D轮廓线,可以得到特定人体更精确的步态分析.Ctmado,Kale和Chellappa[Cunado 1995]把人体大腿的运动匹配到关节钟摆运动模 型上. Yam,Nixon和Carter【Yim 2002]手工标定垂直方向上测量的大腿和小腿的旋转, 并提取旋转角度作为特征来分析,如图2.3所示.《a}Running 图2.3特征标定Dam20021Figure 2.3 Featuremarking[Yam 2002]在Meyer,Denzler和Niemann的工作q6[Meyer 1997】,在视频序列中提取关节对象用 于识别。计算位移矢量场的单调(monotony)算子对人体模型进行初始化,提取不同身 体部位的外轮廓线进行跟踪。确定3D块表示的身体部位运动轨迹并为不同的步态异常 分类.为自动定位不同身体部位,在运动序列的头两帧使用单调算子,目的是计算矢量 场位移.然后通过不同部位的轮廓线提取,跟踪身体运动。估计简单3D块的形状和位 置,并匹配从图像中提取的2D轮廓线和3D块投影到图像的投影轮廓,从而提取身体 的3D形状和位置。如图2.4所示。圈2.4图像序列中基于2D轮廓的身体位置估计[Meyer 199"7】ll 籀.二枣步态识剐概述和步态数姑库based Figure 2.4 Result for estimating the position ofthe body partsOntheir 2D contours forimages[Meyer1997]Lee和CJrimson.用椭圆来匹配运动人体的二值化轮廓的不同身体部分[Lee 2002a],然后提取椭圆的矩特征,如质心位置。离心率等作为特征来分析.Kale和Rajagopalan等[Kale 2004]为每个人选择一组样本(exemplars),使用这些样本生成低维的帧与样本的距离(Frameto ExemplarDistance,FED)向量.FED被用来训练连续的HMM。然后根据特定的HMM模型进行识别.该方法对于速度变化鲁棒性 较强.但是,衣着的较大变化会影响识别性能. Wang和Ning等用锥台表示人体[Wang 2003a],人体由14部分组成.运动表示为 12维的运动向量。通过跟踪得到角度变化,作为动态特性识别步态.Tabb和Davey等[Tabb 2000]研究了使用动态轮廓线来进行步态分析.动态轮廓线模型用来检测人体行走,训练人体运动分析的神经网络.使用7个肢段来建模人体(下 肢是6个肢段,头,胳膊和身体作为一个肢段).测量下肢角度和速度,并计算关节矩. 模型行为通过一组初始状态和矩的历史信息来给定,使用拉格朗日(Lagrangian)力学 来研究人体步态[Onyshko 1980】。 骨架模型中常用棍图研究步态.实验的常用方法可用Johansson的运动光显示(Moving LightDisplay,MLD)方法来实现.点光源附着在人体关节处,周围区域设为黑色.当人体行走,跑,骑自行车或俯卧撑(push-ups),只有光源的相关运动阵列可以 看到.以此为基础,统计分析可以用来分辨动作类型,如腿运动[Guo 1994a],或区分不 同性另lJ[Kozlowski 1977]. 骨架模型的一种变化是Ju,Black和Yaccob等提出的纸板模型(cardboardmodel) [Ju 1996],扩展了Blake和Yacoob的工作[Black 1995]。人体由一组相连的平面片表示。 光流的参数化模型用来处理人体的关节运动。以分析得到的肢体的运动曲线为基础,表 示人体及运,从图像中估计人体3D位置和姿势。 随着硬件越来越便宜,生物测定学的重要性不断增加,基于视频的人体动力学领域 的文章在最近十年成指数增长[Wang 2003d】。 二维高分辨率识别多是基于模型的方法,其要求视频分辨率高,模型匹配及跟踪比 较复杂,而且对于视点、以及其它条件不具有不变性。 二维方法的主要缺陷是其对于摄像机角度的限制以及遮挡问题. 由于当前大部分工作是在二维下完成,而且在限制条件下。二维识别仍有许多工作 可以做,如基于矩的识别,辅助医疗等.但最终解决视点变化及遮挡问题必须依靠三维, 所以也要以三维跟踪为基础,提取全身运动关节作为特征,生成模型,来辅助运动分析,进行仿真,步态识别等。2.3三维步态识别●Dockstader,Bergkessel和Tekalp[Dockstader 2002a,Dockstader 2002b]提出一种基于模型的方法解决人体运动中三维跟踪和步态模式提取.文中使用层次结构的人体模12 中同科学院博'二学位论文一堆十税频的步态识别型,带有hard和soft动力学约束的新颖的动态系统.Hard约束把身体限制加在模型配 置上,如图2.5左图;而soft约束表示从前面的人体运动的例子中学习来的概率密度 (PDF).使用结构的动态模型(如图2.5右图所示),可以得到在各种分辨率上以相应 的鲁棒性和精确性提取步态变量的方法。由于自遮挡和周期性的胳膊摆动的无规则,手、 胳膊对应的跟踪参数误差很大.但下肢跟踪精确度较高,可以用来分析步态。尤其是, 能够精确得到在复杂的室内环境下捕捉的人体运动的多视角视频序列的步态速度,步 宽,步长,胳膊摆动,频率和走路时间.但文中只用两个人的数据做实验,重点是人体 模型的建立和步态跟踪.图2.5结构模型(左图)和运动学约束(右)[Docks她der2002a,Dockstader2002b]Figure 2.5 Structuralobjuect model(1eft)andkinematic modelcontraints[Dockstader2002a’Dockstader2002blUrtasun和Fua[Urtasun 2004]通过Vicon光学运动捕捉系统和跑步机建立几个人走路运动数据库,将其中运动特征表示为特征向量,以此为指导,对多摄像机的视频进行跟 踪,得到沿正交方向相对于平均运动模板的方差参数,来描述运动特征,进行识别.对 四个人的九种速度变化进行了测试. 三维步态识别的优点是对于视点,光照等不敏感,能处理遮挡;缺点是系统复杂, 要求多摄像机,对于衣服变化难以处理.而且要以三维人体运动跟踪为基础,而目前三 维跟踪仍处于起步阶段,仍有许多难点:如自动初始化、有效的高维空间搜索,自适应 多特征融合等问题。三维步态特征的描述和提取也是一个难点。当前的三维步态识别中, 澳9试人数和变化都非常少,难以对算法进行有效评估. 还有一些算法将三维分析得到的简单运动特征和二维形状特征相结合,进行分析和 识别.BenAbdelkader,Cutlel"和Davis在[BenAbdelkader 2002d]中以步长和行走节奏作 为特征进行步态识别。根据轮廓包围盒的宽度来得到行走周期,根据已定标的系统跟踪 计算得到实际步长。在[BenAbdelkader2002b,BenAbdelkader2002c1中除了这两个特征外,加上了人体高度作为特征之一。用正弦模型描述人体在垂直方向的运动,真实高度 由图像中的高度和摄像机参数估计得到。高度特征由平均高度和摆动振幅两个参数组成..其特点是处理低分辨率视频,对于光照,衣着鲁棒,并且具有视点不变性. 这种二维和三维相结合的方法也是一种不错的尝试.由于真正不变的是三维特征, 第二二帝步态识别概述和步态数据库但三维特征的获取比较复杂,二维特征简单,实用性强,但解决步态中的背景、衣着、 光照、发型,观察角度等变化的特征不变性较困难.如果不能完全仅仅依靠二维和三维信息.二维和三维的简单结合也是一种可行的办法。 已有方法的总结:I)实验通常是在受限的条件下进行的,如人体运动期间不被遮挡、相对简单的背 景、相对于摄像机而言人的侧面行走等; 2)目前算法的测试都是在小样本数据库上进行的。一般不超过30人; 3)大部分工作没有统一的标准,很难重复这些研究,因而也缺少和其它方法结果的比较.由于步态是一种时空变化的运动模式,因此它的数据处理量相对较大.像其它生物 特征一样,步态也受一些诸如醉酒、怀孕、关节受伤等物理因素的影响.尽管步态识别 是一个相当新的研究领域,目前已涌现出一些尝试性的工作.但仍需要强调的是,步态 识别研究目前仍处于初级阶段。 对于应用中没有必要获得精确姿势或由于条件限制无法获得精确姿势的情况,二维 方法将非常有效.对于各种没有限制的复杂环境人体运动,和需要获得高层次人体分析 的应用中,三维方法更加有意义.因为最终解决视点变化及遮挡问题必须依靠三维,所 以以三维跟踪为基础,生成模型,提取全身运动关节作为特征,来辅助运动分析,进行 仿真。步态识别等也是研究的热点.使用二维方法还是三维方法。很大程度上取决于具 体应用,不应该简单地抛弃某种方法. 针对以上介绍,本文研究的总体目标是以单个或多个视频序列为输入,通过人体检 测,在图像中分割运动人体,在图像序列中跟踪步态运动,提取二维特征或恢复底层的 三维人体结构提取步态特征,用于背景、光照、衣着、视点等变化鲁棒的身份识别,并 尝试推广到运动性能的分析、辅助临床治疗等领域. 2.4步态数据库2.4.1当前可用数据库 大部分步态方面的研究工作都集中在不同运动类型之间的辨别,如跑,走,慢跑, 爬楼梯,单脚跳等.只在最近几年,步态识别才吸引了众多目光,并成为计算机视觉中 的活跃领域[Sarkar 2005]。’但文章报告的众多工作结果不是局限于数据集大小,就是步态变化太少,难以对算 法进行全面评估.可以说,步态数据库的发展将步态识别研究从开始推动到现在的情况. 目前有以下几种流行数据库,如表2.1所示,我们可以看到各种数据库的大小、拍 摄特点、数据变化性等. 三个数据库.14.下面着重介绍UCSD,CMU和USF三种数据库。因为在我们实验中主要采用了这 中周科学院博{‘学位论文――苹于视频的步态识别表2.1步态数据库数据库UCSD.1998大小 (人数,序列数)6。42 25,600 15。168 18,20场景 以墙为背景 室内,跑步机 室外Magnetic:Tracker数据变化性 时同(分钟) 视点,速度,持物.地面 时间(6月),视点 时问(6月) 视点(前,侧),时间 时间(13人重复。3月) 时间(分钟) 视点(*30。),地面(水 泥地,草地),鞋子,持 物,时间(33人重复。6月)CMU MoBo。2001Georgia Tech,2001Maryland,2001 MIT.200lSouthampton,2001 USF-NIST.200225,100 55,222 24,194 28,112 122.1870室外.30米远 室外.Top mounted 室内 室内,绿色背景 室外NLPR,200220.240室外视点2.4.2ucsD数据库ofUCSD(UniversityCalifomia,SanDiego)数据库0attp://www-mitpress.mit.edu/e-joumals/Videre/001/articles/Little?Boyd/gait/experiment.htmD 于1998年采集。 UCSD数据库的采集方式如图2.6所示,摄像机固定在三脚架上,人在一面静止的 没有反射的墙前走过,每次出现在摄像机区域内只有一个人.整个数据库包含六个人, 每人七段序列.在每个序列中,人体在静止背景前,略微倾斜地从右侧走到左侧.我们 对原始人体轮廓提取通过简单的Gaussian混合模型(Gaussian Mixture Model,GMM) 减背景方法得到.图2.7所示为原始图像和减背景后得到的轮廓.图2.8中蓝色线为行 走中的质心轨迹。原始分辨率:640X480.重采样后的分辨率为:320X 160。0…夺…->◇ 讯一二帝步卷识刺塌述舯步态数据库幽2.6拍摄环境Figure 2.6 Capture condition图2.7 UCSD数据库图像和人体轮廓图Figure 2.7 Image from UCSD database and the windowed body silhouettes图2.8行走人体的质心轨迹Figure 2.8 Centriodtrajectory ofwalking person2.4.3伽MoBo数据库CMU(Carnegie Mellon University)的MoBo(MotionofBody)数据库(http://hid.ri.cmu.edu/Hid/databases.html)是CMU大学机器人研究所2001年三月开始收集 的[Cross 20011。在CMU的3D room中采集,黾面有51个同步摄像机系统。使用其中6个同步高分辨率彩色摄像机(3CCD,progressive scan Sony DXC 9000’s;gamma校正; 自动白平衡,位置标定),均匀摆放在跑步机周围。被拍者要求穿着蓝色牛仔裤和亮色 跑鞋.共记录四种运动:慢走(slow),快走(fast),倾斜地面走(incline)和持球走(ball). 另外记录行走速度,体重,年龄等信息。CMU MoBo数据库包含25个人在跑步机上行走,如图2.9所示。数据从6个不同视点采集,如图2.10所示.在如图2.1l所示环境下拍摄.原始图像大小为486X640。 每段序列340帧,每人7G数据,总量达到180G。数据库中一共200,006图片。 研究表明,在多数步速范围内,跑步机上和地面上行走步伐参数没有根本变化[David 20011.因此,我们在侧面和斜侧面的视频中为每个人提取7个周期作为样本,用于后 面章节中的步态识别。为降低计算时间,将图像大小调整为180X240。在遮挡和噪声测 试中.只对侧面视频进行了实验,其他角度的视频测试方法类似。 中圈科学院博I?学位论文――苹f税额的步态识别图2.925人在跑步机上行走 subjects walkingonFigure 2.9 Twenty fivea treadmillw17j训\譬_T”A曲盐霄1‘7kvr05 7w-口吃7图2.10 CMU的MoBo数据库拍摄时摄像机位置17 旃二帝堆态识剜JI!【述和步态数摧庳Figure 2.10 Cameras position ofdma collection in CMU MoBo database图2.11拍摄环境Figure 2.1 I Capture condition2.4.4USF数据库USF的数据库是USF(UniversityofSouthFlorida)于2001年5月和11月拍摄[Phillips2002a'Phillips 2002b,Sarkar2005]?拍摄时要求沿椭圆行走,如图2.12所示,每个人在两个相似尺寸和形状的椭圆上逆 时针行走。椭圆长轴约15米,短轴5米。两摄像机不是平行的,而是倾斜的。实验中 只取人行走的后半部分数据.在数据获取时使用了两个摄像机,随后通过检查后序帧的 动作,手工对齐来实现同步。原始数据分辨率为720X480。数据在室外采集,因此增加 许多复杂性,如阳光的阴影,背景的运动,以及由于云彩运动引起的阴影运动。数据具 有性别和年龄的差异。该数据库在不同条件下拍摄,是目前为止最大的数据库,具有最 多的人数,最多的视频序列数和最多的步态采集条件变化,如图2.13所示:有两种地面 (水泥地和草地,ConcreteandGrass),两个摄像机角度(左右,相差约30度),两种-鞋子(A和B),两种持物状态(有无公文包),两种时间变化共32种组合。测试时参 考gallery(reference)数据集GAR(草地,鞋子A,右侧摄像机)用作系统数据库,测试probe(tesO集合A(GAL),B(GBR),C(GBL),D(CAR),E(CBR),F(CAL)和G(CBL)包含.,不明身份的序列,通过和参考数掘集比较相似性来实现识yJiJ[Sarkar 2005]。库中包括两 次拍摄的数据,5月份包括74人452序列,共约300GB的数据,11月份数据集达到122 人1870序列,1.2TB。迄今为止,发表的论文中常用的测试数据包含74人在两种地面 上(水泥地C和草地G),穿两种鞋子(A和B),沿椭圆路径行走的两个视点(左视点L和 右视点R)的452序列。USF步态图像和轮廓图如图2.14所示。考虑到处理时间和存储空间(74人452序列,共约300GB的数据),我们直接使用 USF提供的轮廓数据.这些数据有噪声,如身体部分缺失,身体内有洞,脚部严重阴影等.对这样的数据。我们没有做任何附加处理,直接提取特征进行识别,同时测试了对自然噪声的鲁棒性.图2.12USF数据库拍摄配置Figure 2.12 Capture setup in USF databaseNoBr慨 鬻静 ,糍 溯 械。 i鳃麓 努 囊 静; ∞RIMay2001Ho●20州NoBfldca∞?BF,一Bndh∞ o,a,b一辩B BFBndt扪话岛^蕾‘ G,禹k。£疆扎一丑F‘^k,抽B;《蝙 心黼j鼙}茚1一BfC6矗k、BFC,8。L.HB,¥丑,LHBC,a厶BF6声厶=*8f…梦秘Bc’^如BF―q如也8F/ 6声Jb―BF广C,gth。NBG,^Il’HBC^氏 e,,aoa,BF翁FI-§n-jl_ ■刀一b.Iq魏如;舯BoG,B离 C,8凡 甄B熟}驸8一 扛F。 9毒F《BFn.j§;●i;罄;oi;麓orll §W;錾i §-;墨图2.13 USF数据库中步态的32种变化组合Figure 2.13 Thirty two Subsets basedthe various combinations offive oovariates19 第一二帝步态识剐概述和形态数据库盖上太土立j凹2.14USF数据厍幽像Figure 2.14 Images from USF database我们选择这三个数据库来评估算法.UCSD数据库是个小而简单的数据库.但它代 表了可控环境下的小规模识别。CMU MoBo数据库是一个中型数据库。收集了跑步机 上的步态数据。这和训练和医疗应用中的数据类似.USF的数据库在复杂室外环境采集, 人数和视频序列数以及采集状态的变化都是目前为止最大的数据库。在这三个有代表性 的数据库上的实验可以全面测试算法,充分评估算法的有效性。,’20 第三摩人体运动分析概述第三章人体运动分析概述基于视频的步态分析属于人体运动分析领域,涉及到人体步态运动分割、步态运动 跟踪、特征提取和识别等方面,其特征和分析方法也可以进一步推广到步态行为理锯.本章着重介绍相关的背景知识。人体运动的视觉分析,是计算机视觉领域最活跃的研究方向之一,它试图从包含人 体的图像序列中检测、跟踪和识别人体,解释人体行为。人体运动分析在视觉监督、高 层用户交互、基于内容的图像存储和检索、视频会议、运动性能分析、虚拟现实等领域 有潜在的应用,吸引了计算机视觉研究者们极大的兴趣。 许多世界范围的大型研究项目已经进行人体运动分析方面的研究.例如,DARFA(Defense AdvancedResearchProjects Agency)在视频监督和控制方面(VSAM:VideoSurveiUanccandMonitoring)[Collins2000]投资了多个研究所项目,其目的是开发 一种自动视频理解技术,使计算机监视复杂领域的活动,如战场。实时视觉监督系统 W4把形状分析和跟踪结合在一起[Haritaoglu2000],建立了人体外形模型,使之能够检 测和跟踪多个人,即使在室外环境中存在遮挡时仍然能够监视人体的运动。许多研究者 也在车辆和人体的跟踪以及交互识别方面做了大量研究。此外,如IBM和微软等公司 也投资研究人体运动分析[Wang 2003b]。 近几年来,人体运动分析在大量的世界刊物和国际会议和研讨会上占据越来越重要 的地位:IJCV(IntemationalJournal of ComputeronVision),CVIU(ComputerVision and ImageUnderstanding),PRMI(IEEE TransactionsPaaem Analysis and Machine Intelligence)和ConferenceonWC(Imageand VisionComputing)等期刊,ICCV(IntemationalConferenceon onComputerVision),CVPR(Intemational ECCV(EuropeanConferenceComputer Vision and Panem Recognition),OnComputerVision),WACV(WorkshopApplications ofComputer Vision)和IWVS(IEEE International Workshop on Visum Surveillance)等会议中人体运动分析都占据了较大的篇目. 人体运动分析在许多领域有广泛的潜在应用:智能监督系统,高层用户交互,基于 运动的诊断,基于内容的视频检索等. 视觉监督 基于视觉的人体运动分析最有前景的潜在应用之一是视觉监控.智能监控系统的 需求主要来自那些对安全要求敏感的场合,如银行、商店、停车场、军事基地等。监控 摄像机已经在商业公司中流行,摄像机输出通常录在磁带或存储在视频档案室.这些视 频数据当前只能事后作为法庭辩论的工具,失去了作为动态实时媒体的主要优势.现在 需要的是实时分析监视数据来提示安全机构警惕正在进行的入室抢劫,或者有可疑的人 在附近徘徊.除了安全方面的应用外,监督还可用来测试交通流量,公共场所人群的拥塞,购物场所消费者的人口统计等。21 中因平}学院博f学位论文――罐十说频的步卷识剐高级用户交互另一个重要的应用是高级用户交互.人体运动分析常被用来提供控制和指令.通常 说起来,人们之问的交流主要是通过说话来实现.因此.语言理解已经被广泛用于早期 的人机交互上.但是,容易受到环境噪声和距离的限制。视觉对于实现人机之间更加自 然和智能的交流的自然场景理解非常有用.也就是说,可以通过姿势(身体姿态和脸部表情等)得到更多的细节。因此,未来的机器必须能独立感知周围环境,如检测人的存在,解释人体行为等.用户交互领域的应用还包括手语翻译,姿势驱动控制,在高噪声 环境如工厂和机场发信号等. 基于运动的诊断和识别 在图像中分割人体的不同部位,在图像序列中跟踪关节的运动,恢复底层的三维人 体结构对于运动性能的分析和跟踪尤其有用.传统的步态分析目标是提供医学诊断和治 疗支持,人体步态可用作一种新的生物特征用于人体识别。基于视觉的运动分析应用还 包括个性化训练系统,整形外科病人的医疗诊断,舞蹈和芭蕾的编排等. 基于内容的视频检索 随着数字图书馆的发展,使用基于内容的索引自动解释视频序列,将会在大型数据 库中排序和检索图像或视频方面节省大量人力,提高效率. 此外,人体运动分析在其它相关领域也有非常重要的应用.例如,虚拟现实的典型 应用包括聊天室,游戏,虚拟演播室,角色动画。电信会议等.计算机游戏在娱乐中非 常流行.虚拟人和模拟动作的真实性主要得益于处理涉及人体真实模型的计算机图形 学、基于知识的人体运动合成、人体姿态检索、人体行为分析等研究.同时,基于模型 的图像编码(只编码图像中更多细节的姿态,而不是电视电话中不感兴趣的背景)将会 得到低比特率的视频压缩、更高效的图像存储和传输。 1997年,Aggarwal和Cai对97年之前的人体运动分析工作进行综述[Aggarwal 1997].他们最近的综述[Aggarwal 19991包括69篇文章,是前面综述的一个扩展.文中 介绍了98年之前人体运动分析的各种工作,重点是和解释人体运动相关的三个领域:1) 包含人体身体部位的运动分析;2)从一个或多个视点的摄像机跟踪运动人体;3)从图 像序列中识别人体动作。 Gavrila介绍了98年之前的运动分析工作[Gavrila 1999]。重点是讨论各种方法。总 结了在3D跟踪和运动识别方面的将来方向。 王亮,胡卫明,谭铁牛把人体运动的视觉分析系统分为四个方面【王亮2002]:1) 运动检测;2)运动目标分类:3)人的跟踪;4)行为理解与描述,回顾2000年之前人体运 动分析的发展水平和常用的处理方法,并对研究难点及未来的发展趋势作了较为详细的 分析.?’r最近,Wang和Singh介

我要回帖

更多关于 步态识别算法 的文章

 

随机推荐