著录项信息
专利名称 | 一种应用于手势识别的旋转特征码的距离测度方法 |
申请号 | CN201010204595.4 | 申请日期 | 2010-06-18 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2010-10-06 | 公开/公告号 | CN101853073A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F3/01 | IPC分类号 | G;0;6;F;3;/;0;1查看分类表>
|
申请人 | 华南理工大学 | 申请人地址 | 广东省广州市天河区五山路381号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 华南理工大学 | 当前权利人 | 华南理工大学 |
发明人 | 薛洋;金连文 |
代理机构 | 广州粤高专利商标代理有限公司 | 代理人 | 何淑珍 |
摘要
本发明提供了一种应用于手势识别的旋转特征码的距离测度方法,其采用加速度传感器测得用户在三维空间进行书写的三个轴向的加速度信号,并取得该加速度信号分别投影到y-z,z-x,和x-y平面上所对应的旋转特征码Cyz,Czx和Cxy,最后采用编辑距离来度量不同样本的旋转特征码之间的差异。本发明根据从三轴加速度信号中提取了旋转特征之后,针对不同样本的旋转特征码的长度不一致,无法直接计算它们之间的差异,故而采用编辑距离来度量不同样本的旋转特征码间的差异,使得旋转特征可有效应用于字符识别领域。
1.一种应用于手势识别的旋转特征码的距离测度方法,其特征在于采用加速度传感器测得用户在三维空间进行书写的三个轴向的加速度信号,并取得该加速度信号分别投影到y-z,z-x,和x-y平面上所对应的旋转特征码Cyz,Czx和Cxy,最后采用编辑距离来度量不同样本的旋转特征码之间的差异,所述编辑距离的度量方法如下:
令符号序列 为第i个样本的Cyz编码, 为第j
个样本的Cyz编码, 再令E={es,ei,ed}分别表示序列 变换为 时替换、插入和删除一个符号的代价,则 和 的编辑距离递归地表示为:
其中,
至此计算出旋转特征码Cyz的编辑距离,
根据上述编辑距离的度量方法能相应地计算出旋转特征码Czx和Cxy的编辑距离。
2.根据权利要求1所述的应用于手势识别的旋转特征码的距离测度方法,其特征在于替换、插入和删除符号的代价为1,即es=ei=ed=1。
3.根据权利要求1或2所述的应用于手势识别的旋转特征码的距离测度方法,其特征在于所述编辑距离还进行归一化,所述 和 的归一化编辑距离表示为:
其中, 分别表示序列 和 的长度,
相应地计算出Czx和Cxy的归一化编辑距离。
4.根据权利要求1或2所述的应用于手势识别的旋转特征码的距离测度方法,其特征在于所述第i个样本和第j个样本的旋转特征码间的距离表示为:
其中, 和 分别是第i个样本和第j个样本的Czx编码和Cxy编
码的编辑距离。
一种应用于手势识别的旋转特征码的距离测度方法\n技术领域\n[0001] 本发明属于模式识别与人工智能技术领域,特别是涉及一种应用于手势识别的旋转特征码的距离测度方法。\n技术背景\n[0002] 基于加速度传感器的人运动识别是近年来计算机领域中新兴起的研究前沿方向之一,即将加速度传感器穿戴在用户身上或将它集成在手机或PDA等手持设备上,通过分析人运动时所产生的加速度信号来进行检测、识别用户的运动状态并对其行为进行理解和描述,它属于穿戴式计算(Wearable Computing)和普适计算(Ubiquitous Computing)的重要研究内容之一。\n[0003] 目前,基于加速度传感器的人运动识别主要包括人运动状态识别和人手势识别两方面。运动状态识别主要是识别人在日常生活中走路、跑步、坐着、站立等基本动作;而手势识别主要是识别一些简单的电话手势、自定义的用于控制设备的简单手势、阿拉伯数字\n0-9。基于加速度传感器的人运动识别的关键在于特征提取,许多研究人员都从加速度信号中提取了有效的特征用于识别人的运动状态和手势,综合起来可以把这些特征分成两类:\n时域特征和频域特征。常用的时域特征主要有:均值、方差或标准差、两轴之间的相关系数、加速度信号的峰值和谷值等等;常用的频域特征有FFT系数等。\n[0004] 在基于加速度传感器的人手势识别中,识别在三维空间书写的阿拉伯数字0-9受到一些研究人员的重视,因为基于三轴加速度传感器的三维空间书写不同于传统的二维平面书写,用户只需要手握嵌入三轴加速度传感器的书写设备在空中自由书写,它既不受某个特定的书写平面的限制(如手写板、触摸屏),也不需要任何外挂设备(如摄像头),提供了一种全新的数字笔实现方式,因而具有很好的应用研究价值。\n[0005] 尽管在基于三轴加速度信号的手势识别领域的研究人员已经从事了大量的研究工作,但从目前已公开的技术来看,如何从书写过程产生的三轴加速度信号中提取有效的特征还是一个研究难点,而且提取有效特征后,如何将该特征进行有效处理更是没有相关公开资料。\n发明内容\n[0006] 本发明的目的在于提供一种应用于手势识别的旋转特征码的距离测度方法。\n[0007] 为了实现上述发明目的,采用的技术方案如下:\n[0008] 一种应用于手势识别的旋转特征码的距离测度方法,其采用加速度传感器测得用户在三维空间进行书写的三个轴向的加速度信号,并取得该加速度信号分别投影到y-z,z-x,和x-y平面上所对应的旋转特征码Cyz,Czx和Cxy,最后采用编辑距离来度量不同样本的旋转特征码之间的差异。\n[0009] 上述技术方案中,所述编辑距离的度量如下:\n[0010] 令符号序列 为第i个样本的Cyz编码, 为\n第j个样本的Cyz编码, 再令E={es,ei,ed}分别表示序列 变换为 时替\n换、插入和删除一个符号的代价,则 和 的编辑距离递归地表示为:\n[0011] \n[0012] 其 中,\n[0013] \n[0014] 相应地计算出Czx和Cxy的编辑距离。\n[0015] 所述编辑距离还进行归一化,所述 和 的归一化编辑距离表示为:\n[0016] \n[0017] 其中, 分别表示序列 和 的长度,\n[0018] 相应地计算出Czx和Cxy的归一化编辑距离。\n[0019] 所述第i个样本和第j个样本的旋转特征码间的距离表示为:\n[0020] \n[0021] 其中, 和 分别是第i个样本和第j个样本的Czx编码和\nCxy编码的编辑距离。\n[0022] 本发明根据从三轴加速度信号中提取了旋转特征之后,针对不同样本的旋转特征码的长度不一致,无法直接计算它们之间的差异,故而采用编辑距离来度量不同样本的旋转特征码间的差异,使得旋转特征可有效应用于字符识别领域。\n附图说明\n[0023] 图1是基于加速度传感器的三维书写字符识别的流程图;\n[0024] 图2是本发明的基于y-z平面提取的旋转特征;\n[0025] 图3是本发明的对加速度的方向变化的编码图;\n[0026] 图4是本发明的距离测度方法流程图。\n具体实施方式\n[0027] 下面结合附图对本发明做进一步的说明。\n[0028] 基于旋转特征的三维空间书写识别算法的系统流程图如附图1所示,具体步骤包括:\n[0029] 1、预处理\n[0030] 对于采集到的三维加速度信号首先通过减去均值去除重力加速度的影响,然后进行幅度归一化处理,接着对其进行高斯滤波,滤除加速度信号中包含的测量时的噪声及由于手腕抖动产生的噪声。\n[0031] 2、提取旋转特征码\n[0032] 基于加速度传感器的三维空间书写不同于传统的二维平面书写,它采集不到书写者的书写轨迹,只能获得由三轴加速度传感器测得的三个轴向的加速度信号。如何利用这三个轴向的加速度信号来识别出书写者写的是什么,特征提取是关键。\n[0033] 三轴加速度传感器能同时测量手势运动时产生的相互正交的三个轴向的加速度,分别用ax(t),ay(t),az(t)表示x轴、y轴和z轴的加速度信号。\n[0034] 记A(t)=[ax(t),ay(t),az(t)]是某个手势运动时产生的一个三轴加速度信号,信号的长度记为S。定义\n[0035] B(t)=A(t)×A(t+1) (1)\n[0036] 则B(t)也是一个矢量,且B(t)的方向只有两种情况,一种是垂直于A(t)和A(t+1)的平面向上,另一种是垂直于A(t)和A(t+1)平面向下。当B(t)的方向垂直于A(t)和A(t+1)的平面向上时,加速度信号A(t)从t到t+1时刻逆时针旋转;当B(t)的方向垂直于A(t)和A(t+1)的平面向下时,加速度信号A(t)从t到t+1时刻顺时针旋转。\n[0037] 当t从0变化到S-1时刻加速度信号就会产生一系列的顺时针和逆时针旋转,即书写每个字符时,加速度信号都会产生一系列的顺时针和逆时针旋转变化。本发明提出的旋转特征正是记录三维空间书写时加速度信号产生顺时针旋转和逆时针旋转的变化过程。\n[0038] 对于一个三维空间书写时产生的三轴加速度信号A(t),分别从三维空间中下述三个投影特征:\n[0039] Ayz(t)=[ay(t),az(t))]\n[0040] Azx(t)=[az(t),ax(t)] (2)\n[0041] Axy(t)=[ax(t),ay(t)]\n[0042] 式(2)中,二维矢量Ayz(t),Azx(t),和Axy(t)分别是三轴加速度信号A(t)在y-z,z-x,和x-y平面的投影。\n[0043] 以Ayz(t)为例来说明提取的旋转特征,根据式(1)可以做如下定义:\n[0044] Byz(t)=Ayz(t)×Ayz(t+1) (3)\n[0045] 则Byz(t)的方向垂直于Ayz(t)和Ayz(t+1)平面向上时加速度Ayz(t)逆时针旋转;\nByz(t)的方向垂直于Ayz(t)和Ayz(t+1)平面向下时加速度Ayz(t)顺时针旋转。如果把每个时刻的顺时针和逆时针旋转都记录下来,通过观察会发现:在某个时间段内,加速度信号一直在做顺时针(或逆时针)旋转。所以没必要把这个时间段内的每个时刻点都取为旋转特征。记第i个旋转特征为RFyz(i),i>1。则旋转特征RFyz(i)的提取满足如下原则:\n[0046] Rfyz(1)=Ayz(0)\n[0047] RFyz(i)=Ayz(t+1),当Byz(t)和Byz(t-1)的方向相同,但\n[0048] Ayz(t+1)和Ayz(t)不在同一象限;或\n[0049] 当Byz(t)和Byz(t-1)的方向相反时\n[0050] RFyz(i)是一个由ay(t)和az(t)确定的矢量。由于旋转是由矢量的方向决定的,所以在用ay(t)和az(t)表示提取的旋转特征RFyz(i)时,将矢量的大小取为相等。附图2是对6个人书写数字8时产生的三轴加速度信号基于y-z平面提取的旋转特征点RFyz(i),并把它们用y轴和z轴的加速度[ay(t),az(t)]表示出来。图中垂直方向的轴表示ay(t),水平方向的轴表示az(t),箭头指向是各个轴的加速度方向。\n[0051] 为了方便进行数字运算,规定了如附图3所示的加速度方向变化的编码规则。对附图2提取的旋转特征RFyz(i)进行编码得到旋转特征码Cyz,同样,可以对Azx(t)和Axy(t)提取旋转特征点并进行上述编码,得到旋转特征码Czx和Cxy。一个三轴加速度信号的旋转特征码表示为C={Cyz,Czx,Cxy},Cyz,Czx和Cxy分别是对Ayz(t),Azx(t),和Axy(t)的加速度变化顺序的编码。\n[0052] 3、生成每个类的模板\n[0053] 从总样本中随机选取k个样本作为训练样本,将训练样本中相同类别的样本放在一起,在每个类别中,分别计算每个样本和类内其他样本的旋转特征码间的编辑距离之和,然后将样本按编辑距离之和从小到大排列后作为每个类的类模板。\n[0054] 4、生成训练样本集\n[0055] 计算每个训练样本和所有类模板的旋转特征码间的编辑距离,作为该样本的特征。则对k个训练样本可以得到一个k×k的训练特征矩阵:\n[0056] \n[0057] 其中, 是第i个训练样本和第j个类模板间的距离,i=1,2,…k,j=1,\n2,…k,k是所有类的类模板数。\n[0058] 5、生成测试样本集\n[0059] 对每个测试样本,计算它和所有类模板的旋转特征码间的编辑距离,作为该测试样本的特征。对l个测试样本就可以得到一个l×k的测试特征矩阵:\n[0060] \n[0061] 其中, 是第i个测试样本和第j个类模板间的距离,i=1,2,…l,j=1,\n2,…k,l是测试样本的个数,k是所有类的类模板数。\n[0062] 上述第3、4、5步骤所采用的编辑距离计算是核心关键之一,也是本发明的具体内容,具体如附图4所示:\n[0063] 由于不同样本的旋转特征码的长度不一致,无法直接计算它们之间的差异,采用编辑距离来度量不同样本的旋转特征码间的差异。\n[0064] 设符号序列 为第i个样本的Cyz编码, 为\n第j个样本的Cyz编码, E={es,ei,ed}分别表示序列 变换为 时替换、插\n入和删除一个符号的代价,则 和 的编辑距离递归地表示为:\n[0065] \n[0066] 其 中,\n在这里,替换、插入和删除符号的代价与符号的\n具体取值及其在序列中的位置无关,一般情况下,可取替换、插入和删除符号的代价为1,即es=ei=ed=1。\n[0067] 由于编辑距离度量的是2个序列之间差异的绝对值,在分析长度变化范围较大的序列时,容易使长序列之间的编辑距离远大于短序列之间的距离。这显然是不合适的,因此需要对其进行归一化。上述符号序列 和 的归一化编辑距离表示为:\n[0068] \n[0069] 其中, 分别表示序列 和 的长度。\n[0070] 所以,第i个样本和第j个样本的旋转特征码间的距离可表示为:\n[0071] \n[0072] 其中, 和 分别是第i个样本和第j个样本的Czx编码和\nCxy编码的编辑距离。\n[0073] 6、支持向量机(SVM)分类\n[0074] 用上面生成的训练样本集训练SVM分类器,然后用SVM分类器识别出每个测试样本书写的数字。\n[0075] 本发明的优异性能通过大样本的实验得到了证实。下面描述采用本发明所述的距离测度方法,对大量三维空间书写数字样本进行相关实验的结果。\n[0076] 由于基于加速度传感器的三维空间书写数字识别是一个新兴发展起来的识别技术,目前还没有一个公共的数据库。本实施例设计了基于三轴加速度传感器的加速度信号采集器,采集了60个人的数据,每个采集者单手握着加速度信号采集器在三维空间自由书写数字0到9,每个采集者书写三遍,共采集到180套数据。每个类随机选取144套样本(占每类总样本数的80%)进行训练,总训练样本数为1440,余下的36套样本用于测试,总的测试样本数目为360。\n[0077] 在实验中将本发明提出的旋转特征与峰值谷值特征、时域原始特征及传统的频域FFT特征的性能做了比较。对每个特征,进行了三次实验,然后取平均值。表1给出了每个类别基于四种特征提取方法的识别率。\n[0078] 表1 四种不同特征对10个空中手写数字的识别率的比较\n[0079] \n[0080] 由表1中可以看到,采用本发明提出的旋转特征及其距离测度,其识别率明显高于时域原始特征、峰值谷值特征、及FFT特征。而且,对于每个类别,基于旋转特征的识别率都是较高的,实验结果表明由本发明所述的方法获得的旋转特征在识别性能方面的有效性。
法律信息
- 2019-05-31
未缴年费专利权终止
IPC(主分类): G06F 3/01
专利号: ZL 201010204595.4
申请日: 2010.06.18
授权公告日: 2012.12.26
- 2012-12-26
- 2010-11-24
实质审查的生效
IPC(主分类): G06F 3/01
专利申请号: 201010204595.4
申请日: 2010.06.18
- 2010-10-06
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2010-04-14
|
2009-10-22
| | |
2
| |
2009-12-02
|
2009-05-26
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |