—188
岳维松,苏开娜
(北京工业大学计算机学院,北京 100044)
摘 要:针对人体行走时在空间呈现出的不同几何模式,介绍了一种基于几何参数的步态识别方法,利用Gabor 滤波器在不同角度上的滤波特性,对步态图像滤波的基础上,通过扫描二值图像提取人体的步态几何特征:两脚间的宽度、两腿与人体垂直中线的夹角以及两腿交叉点的坐标;步态的分类采用改进后的动态时间扭曲(DTW )方法进行动态模板匹配,基于CASIA 步态库的测试表明,该方法的分类准确率达90%。实验结果表明,基于几何参数的步态识别,可以有效地区分不同的运动主体。 关键词:步态识别;Gabor 滤波;动态时间扭曲 Gait Recognition Based on Gait’s Geometry Parameter
YUE Weisong, SU Kaina
(Computer College, Beijing Polytechnic University, Beijing 100044)
【Abstract 】Gaits recognition can be used in identifying or intelligent monitor systems. As man walking, their gaits show different geometry patterns. A gait recognition method based on gait’s geometry parameter is introduced. Firstly a serial of gait image is filtered by Gabor filters for its different character in different direction. Then the gait’s geometry parameters are get by scanning the filtered images. Each image is presented by an abstract point which has four dimensions: step gap, angle fore leg swung refer to middle vertical line of body, angle back leg swung refer to middle vertical line of body and the cross point height two legs crossed. Last reference templates are built and gait patterns are classified based on weighted dynamic time warping matching. Test on CASIA gait Lib. shows that the correction of classification reaches on 90%. Hence, result shows that the gait recognition based on gait’s geometry parameter can be used to distinguish different moving person effectively. 【Key words 】Gait recognition; Gabor filter; Dynamic time warping (DTW)
计 算 机 工 程Computer Engineering 第32卷 第9期
Vol.32 № 9 2006年5月
May 2006
·人工智能及识别技术·
文章编号:1000—3428(2006)09—0188—02
文献标识码:A
中图分类号:TP391.41
目前关于人体步态识别的研究方向主要有两个:(1)首先
从2-D 图像恢复3-D 结构,接着通过3-D 结构信息识别运动着的目标,以这种理论为基础的识别方法称为SFM(Structure From Motion)[1],也可称为模型的识别;(2)直接根据运动模式识别人体的步态运动[2],即Motion-Based Recognition 方法。本文讨论的方法是通过提取步态的几何参数特征,从而研究步态的运动模式,达到分类的目的。
1 步态特征的提取
1.1 定量描述步态的几个特征
通过观察可以发现,描述步态特征的最直接的参数有两腿交替的频率f s ,行进中的步幅g s ,行走时两腿与身体垂直方向的夹角,若“前腿”用Lf 表示,“后退”用Lb 表示,垂直中线用Lm 表示,则“前腿”Lf 和Lm 的夹角为θf m ,“后腿”Lb 和Lm 的夹角为θbm ,以及膝部的位置和摆动的角度,以及腿在行进
过程中的弯曲程度。这里所说的前后腿并不特指哪条腿,而是按照脚部是处于身体前还是处于身体后的标准来区分;对具体的某条腿来说,在一步的周期中,可能前半个周期处于“前腿”Lf 状态,而后半个周期处于“后腿”Lb 状态。考虑到计算的复杂性,本文取“前腿”Lf 和Lm 的夹角为θf m ,“后腿”Lb 和Lm 的夹角为θbm ,两脚之间的跨度g s
高度h 作为步态分析的特征,见图1 1.2 基于Gabor 滤波结果的特征抽取
偶对称2-D 的Gabor 核函数具有如下形式[3]:
()22,,22''',exp cos 2exp 22x x y g x y λθσπλσσ⎛⎞⎛⎞⎛⎞=−−⎜⎟⎜⎟⎜⎟⎝⎠⎝⎠⎝⎠
usb转换>()(),,,f x f y λθσθσ= (1)
其中,
' cos sin ,
'sin cos x x y y x y θθθθ=
+=−+,
()2,2'exp 2y f y θσσ⎛⎞=−⎜⎟⎝⎠
, ()2,,2''exp cos 22x x f x λθσπσλ⎛⎞⎛
⎞=−⎜⎟⎜⎟⎝⎠⎝⎠ 根据人体行走时,两腿在空间分布的纹理特性,分别构
造0˚、30˚、60˚、90˚方向的Gabor 滤波器对步态序列图像进行滤波。经过选取合适的Gabor 核函数的空间频率,实验证明,Gabor 滤波可以抑止步态图像大部分的背景噪声。最终得到步态图像的二值图像,见图2(a)。 基于二值图像的特征抽取,本文采取垂直投影和水平扫描的方法。
要确定两脚之间的跨度以及两腿与垂直中线的夹角,首先要确定两脚和两腿交叉点所在的坐标。因此,水平扫描二值图像,以寻脚部所在的基线(纵向坐标为Y0)。采取以Y0为基准的垂直投影,见图2(b),可以确定两脚的水平轴坐
基金项目:北京市自然科学基金资助项目(4031004);北京市教委科技发展计划资助项目(km200310005006)
作者简介:岳维松(1971—),男,硕士生,主研方向:模式识别与多媒体技术;苏开娜,教授
收稿日期:2005-06-03 E-mail :c_s_c_
—189—
标,这里用Xmin ,Xmax 表示。有了两脚的X 坐标后,可以以此为搜索区间,逐渐搜索出两腿交叉的点,其X 轴坐标为Xmid ,纵方向的坐标为Y 。这样参数:
g s =Xmax – Xmin (2) h= Y – Y0
(3)
θf m = ( Xmax – Xmid ) /cross h (4) θbm = (Xmid - Xmid ) /cross h
(5)
(a) (b) 图2 步态特征参数的提取
对于步态序列图像,如果把每幅图像的得到的参数θf m 和θbm 以曲线的方式表示出来,可以反映一个人行走时的周期运动,见图3。从理论上分析可知人体的步态应该呈现连续的,相对光滑的周期性曲线,而图3中在几个大的峰值旁边都存在小的局部峰值,这是在实际计算时由于各种因素导致的误差,但整个曲线还是反映了人行走时的周期性特性。
40图像帧数
10.90.80.70.60.50.40.30.20.1
角度(弧度)前退与中线之间的角度
0 5 10 15 20 30 35 40
0 5 10 15 20 30 35 40
fm bm 2 样本训练
通过上面的特征提取分析可知,步态系列可以用一系列的采样点来表示,每一点包含4个几何特征信息:两脚间的宽度,两腿与人体垂直中线的夹角以.及两腿交叉点的高度,而且这4个参数之间是相互独立的。设步态序列图像共有J 帧采样,且令s 1=g s 、s 2=θf m 、s 3=θbm 、s 4=cross h ,有
1234(,,,) ( n=1,2,,J)n S s s s s =K (6) 两帧图像所代表的步态特征的差异可以使用欧氏距离进
行度量,而步态的识别需要两两比较多个步态序列之间的差异。由于不同的两步序列采样中,所采集到的图像帧数不同,而且两个子序列图像所表征的步态也不是一一对应的,这给步态比较识别带来一定的难度。根据步态序列的这一特点,结合动态模板匹配理论[4],本文采用改进后的动态模板匹配方法实现步态的识别。
利用对应点加权平均的方法[5]获得标准模板。用这里采取累计学习修正的方法确定M ,M = m(1), m(2), m(3), ..., m()J 表示标准模板。如果用N 个样本序列进行训练,则定义每一
机器人拉车步的训练结果分别用(1)(2)(N)M ,M ,,M K 表示。任取一个真实样本的步态序列,以M 1=〈m 1,1,m 1,2,…,m 1,L1〉,长度
为L 1,把该向量序列作为标准模板的初始值,即M (1)=M 1,并且定义标准模板每一点的权重(1)()
w i 为每一点的匹配次数,即(1)()1w i =,1≤i ≤L 1。然后,取下一个步态序列样本M 2,长度为L 2,把M 2与标准模板M 作动态匹配,匹配的准则是
欧氏距离平均最小。
因为人体不同两步中步态序列的长度不应相差太大,也就是12||3L L −≤,所以在两个步态特征序列匹配时,选择搜索窗的宽度为3,如果12||3L L −>,则二者相差较大,模板不进行修改,否则保存匹配路径,并且按照式(7)修正标准模板向量。匹配路径表明了该距离意义下全局最优的序列点对应关系。假设匹配路径上标准模板向量(1)()m i 与真实样本向量(2)(2)(2)(),(1),,(1)m j m j m j k ++−K 对应,则修正标准模板向量的公式可表示为
(1)(1)(2)(2)(2)
11(2)(2)(1)()()()()i j j j k i w i m m m m m w i k
w i w i k
++−×++++=+=+K (7)
按照这种方法,把N 个训练样本序列依次进行动态匹配,这样经过累计学习可以得到标准模板 M = m(1), m(2), m(3),..., m()J
同一人的N 个样本特征序列虽然包含这个人步态大部分的真实信息,但由于采样方法和特征提取方法的缺陷,总有误差和噪声存在。因此训练过程也是从样本到某人步态真实信息特征的过程。
将两个序列进行动态匹配,以得到最优匹配路径,同时记录标准模板每一点的匹配次数为N(j),匹配距离之和为S(j),其中1≤j ≤J ,J 是标准模板的匹配长度。将所有样本步态序列逐个和标准模板作上述匹配时,累计标准模板每一点的匹配次数N(j)和匹配离之和S(j)。在训练完成后,那么标准模板每一点的平均匹配距离函数为
D(j)=S(j)/N(j) (8) 由平均匹配距离函数D(j)可见,匹配次数越多,并且S(i)越小,则D(j)越小,说明标准模板上的该特征点越能真实代表步态的特征信息,从概率角度分析,它应该被同类大多数的样本序列所包含。反之,如果D(j)值越大,说明该点所代表的特征在同类的不同样本中畸变较大,属于不可靠点,容易受到噪声的影响。
根据以上分析,可以定义加权函数w(j)=1/D(j), 1≤j ≤J 。D(j)越小,w(j)值就越大,该点就越重要。因此,w(j)实际上是步态稳定特征一种数值度量。
3 加权动态匹配
本文是基于步态的4个几何特征信息:两脚间的宽度,两腿与人体垂直中线的夹角以及两腿交叉点的
高度,实现人体步态的分类。但有时候,这4个特征在不同类样本之间非常接近,可分性比较差,因此为了增强不同类样本之间的可分性,引进了加权动态匹配的方法来实现不同类步态样本的分类。
设测试样本序列为T = (1), (2), (3),...,()t t t t I ,与经过训练得到的标准模板序列
M = m(1),
m(2), m(3),...,m()J 进行动态匹配。实际计算中采用动态规划算法,假设D(i-1,j-1)为T 中前i-1个与M 中前j-1个特征点之间的最优匹配,那么(1), t(2),...,t()i 与m(1), m(2),...,m()j 的最佳匹配应为
i j D(i,j)= D(i-1,j-1)+w(j)d(m ,t ) (9) 其中,1<i<I,1<j<J,|I-J|3≤,w(j)为各点的加权函数。 由标准模板训练过程可知,如果步态序列中某特征点更
稳定,那么它的加权系数也越大,使得稳定点上的微小畸变能引起匹配距离较大的变化,从而增强不
同类样本的可分性。
(下转第192页)
:ontology foo
:content " 'W. Richard Stevens is the author of TCP/ IP Illustrated' is true"
将其转换成XML格式:
< message>
<operation value="ask-all"/>
<sender name="R"/>
<receiver name="P"/>
<in-reply-to value="id1"/>
<reply-with value="id2 "/>
核桃去壳机<language name=" FIPA RDF ">
<ontology name="foo">
<content>
<?xml version="1.0" encoding="UTF-8" ?>
<rdf:RDF
xmlns:rdf="/1999/02/22-rdf-syntax-ns#"
xmlns:fipa=/schemas/fipa-rdf0#">
哺乳睡衣
< fipa:Proposition >
<rdf:subject > TCP/IP Illustrated </rdf:subiect >
<rdf:predicate rdf:resource = "/schema# author/>
<rdf:obect>W.Richard Stevens</rdf:object>
<fipa:belief> true</fipa;belief>
</fipa;Proposition></rdf:RDF ></content></message>
用SOAP协议实现定义的message:
POST /demostation HTTP/1.1
Host:
Content-Type:text/xml
Charset="gbk"
SOAP Action:"Some URI"
<SOAP-ENV:Envelop
tsf过载保护xmlns: SOAP-ENV=/soap/envelope/
SOAP-ENV:
encodingStyle=/soap/encoding/>
<SOAP-ENV:body><message xmlns:m="Some URI"><operation value="ask-all"/上述message内容</message></SOAP-ENV:body> <SOAP-ENV:envelope>
4 结论
本文介绍了一种基于Web service与MAS集成系统的通信机制,实现了Web service与MAS优势互补。用基于描述逻辑的推理机制对多Agent系统进行服务发现与匹配,使Agent在通信中语义表达更精确,推理能力更强,有效地解决了基于SOAP/XML的Web service在通信中缺乏智能性的问题,实现了Web service的社交智能。在此基础上使用Web service协议进行服务调用,很好地发挥了Web service通信在异构平台实现互操作的优势。
参考文献
1 Diego C, Maurizio L. Description Logics for Conceptual Data Modeling[C]. Conference on Logics for Databases and Information Systems, 1998: 229-263.
2 王洪伟, 吴家春, 蒋馥. 基于本体模型的信息检索机制研究[J]. 情报学报, 2004, 23(1).
3 王洪伟, 吴家春, 蒋馥. 基于描述逻辑的本体模型研究[J]. 系统
工程, 2003, 21(3).
4史忠植, 蒋运承, 张海俊等. 基于描述逻辑的主体服务匹配[J]. 计
算机学报, 2004, 27(5).
5 韩晓峰, 徐良贤. 基于Web服务的多Agent系统的研究[J]. 计算机
仿真, 2004, 21(1).
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ (上接第189页)
4
基于动态模板匹配,使用最近邻的判决准则,对CASIA 步态库中的10个人的步态序列进行了测试(如表1),分类的准确率达90%。取每个人平行于摄像镜头平面的4个序列,使用其中3个序列作为训练样本序列,留另外一个序列作为测试序列。
5 结论
根据人体步态的特有特征,利用Gabor滤波器在不同角度上的滤波特性,对步态图像滤波的基础上,提取了步态的4个几何特征,作为步态序列每一个状态的特征参数。进而运用动态模板匹配方法实现步态的分类,实验证明本文提出的方法可以有效地实现步态识别分类。1 Hoffmana D, Flinchbaugh B. The Interpretation of Biological Motion[J]. Biological Cybernetics,1982, 42(3): 195-204.
2 Fujiyoshi H, Lipton D. A Real-time Human Motion Analysis by Image Skeletonization[C]. Proc. IEEE Workshop on Applications of Computer Vision, Princeton, NJ, 1998: 15-21.
3 Daugman J. Entropy Reduction and Decorrelation in Witual Coding by Oriented Neural Receptive Filed[J]. Trans. on Biomedical Engineering, 1989, 36(1): 107-114.
4张宏林. 数字图像模式识别技术及工程实践[M]. 北京: 人民邮电出版社, 2003: 299-302.
5 陆玖, 包闻亮, 李锋. 一种波形匹配新算法: V-P-V算法——用于中文签名识别[J]. 复旦大学学报, 1996,
35(5): 67-74.
—192—