著录项信息
专利名称 | 一种数据手套的模糊手语识别方法 |
申请号 | CN201410655579.5 | 申请日期 | 2014-11-17 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2015-03-04 | 公开/公告号 | CN104392237A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/52 | IPC分类号 | G;0;6;K;9;/;5;2;;;G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 广州畅途软件有限公司 | 申请人地址 | 广东省东莞市松山湖高新技术产业开发区新城路大学创新城D-1栋2楼224室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 东莞市易联交互信息科技有限责任公司 | 当前权利人 | 东莞市易联交互信息科技有限责任公司 |
发明人 | 郝志锋;王可炜;周言明;陈曦 |
代理机构 | 广州嘉权专利商标事务所有限公司 | 代理人 | 谭英强 |
摘要
本发明公开了一种数据手套的模糊手语识别方法,包括以下步骤:获取手部动作数据并对其进行模糊处理,得到手势帧序列;根据手语数据库和概率数据库,对得到的手势帧序列进行识别处理,得到手势帧序列识别结果。本发明通过对手部动作数据进行模糊处理,有效避免了因手掌大小不一造成的识别率较低的问题,而且通过结合手语数据库和概率数据库,使得本发明能根据前后手势选取当前手势最优的识别,大大提高手势识别的准确率。本发明作为一种数据手套的模糊手语识别方法可广泛应用于手语识别产品中。
1.一种数据手套的模糊手语识别方法,其特征在于,包括以下步骤:
A、获取手部动作数据并对其进行模糊处理,得到手势帧序列;
B、根据手语数据库和概率数据库,对得到的手势帧序列进行识别处理,得到手势帧序列识别结果;
所述的步骤A包括:
A1、获取手部动作数据中的各个手指的弯曲角度,并根据预设的弯曲隶属度函数,得出对应的各个手指的弯曲状态;
A2、获取手部动作数据中的手掌俯仰角,并根据预设的俯仰隶属度函数进行计算,得出结果值最大的即为对应的俯仰状态;
A3、获取手部动作数据中的手掌倾斜角,并根据预设的倾斜隶属度函数进行计算,得出结果值最大的即为对应的倾斜状态;
A4、获取手部动作数据中的手掌偏航角,并根据预设的偏航隶属度函数进行计算,得出结果值最大的即为对应的偏航状态;
A5、根据计算得到的俯仰状态、倾斜状态和偏航状态,结合预设的规则,得出对应的手掌朝向;
A6、根据手掌朝向和各个手指的弯曲状态,得出手势帧,并进而得出手势帧序列;
所述的步骤A1中的弯曲隶属度函数为:
其中,x∈U0,U0表示手指弯曲角度,U0=[0,120],在U0上建立手指弯曲角度的三个模糊集,A0表示弯曲状态为“伸直”的状态,A1表示弯曲状态为“半弯曲”的状态,A2表示弯曲状态为“紧握”的状态。
2.根据权利要求1所述的一种数据手套的模糊手语识别方法,其特征在于:所述的步骤B包括:
B1、获取手势帧序列,依照从头到尾的顺序提取手势帧;
B2、将提取的手势帧分别依次放入对应的结点中;
B3、依次从手语数据库中提取各个手势帧对应的所有字词,并将其附加进对应的结点中,直到手势帧序列上所有手势帧均完成手语数据库的检索;
B4、将相邻两个结点所附带的字词按照结点的顺序分别两两组合,组合中由上一个结点的字词指向下一个结点的字词;
B5、将所有组合分别在概率数据库中索引出各组合的概率;
B6、查找出各组合组成的句子中概率和最大的一个句子,得出手势帧序列识别结果。
3.根据权利要求1所述的一种数据手套的模糊手语识别方法,其特征在于:所述的步骤A2中的俯仰隶属度函数为:
其中,x∈U1,U1表示手掌俯仰角,U1=[-90,90],在U1上建立俯仰角的三个模糊集,B0表示俯仰角为“俯”的状态,B1表示俯仰角为“水平”的状态,B2表示俯仰角为“仰”的状态。
4.根据权利要求1所述的一种数据手套的模糊手语识别方法,其特征在于:所述的步骤A3中的倾斜隶属度函数为:
其中,y∈U2,U2表示手掌倾斜角,U2=[-180,180],在U2上建立倾斜角的三个模糊集,C0表示倾斜角为“左倾”的状态,C1表示倾斜角为“水平”的状态,C2表示倾斜角为“右倾”的状态,C3表示倾斜角为“翻转水平”的状态。
5.根据权利要求1所述的一种数据手套的模糊手语识别方法,其特征在于:所述的步骤A4中的偏航隶属度函数为:
其中,z∈U3,U3表示手掌偏航角,U3=[0,360],在U3上建立偏航角的三个模糊集,D0表示偏航角为“前”的状态,D1表示偏航角为“右”的状态,D2表示偏航角为“后”的状态,D3表示偏航角为“左”的状态。
6.根据权利要求1所述的一种数据手套的模糊手语识别方法,其特征在于:所述手语数据库以手指弯曲状态和手掌朝向形成的手势帧作为索引,手势对应的字词作为被索引的内容。
7.根据权利要求1所述的一种数据手套的模糊手语识别方法,其特征在于:所述概率数据库中的字词组合的概率为利用语言模型训练工具SRILM得到。
一种数据手套的模糊手语识别方法\n技术领域\n[0001] 本发明涉及手势识别领域,尤其涉及一种数据手套的模糊手语识别方法。\n背景技术\n[0002] 手势识别国内外科学家已经进行过了大量研究。1994年,Ramon M S和Dannil T研制了一种基于物理约束的手抓取过程的手动作合成的控制与抓取系统。1995年,Lee J intae和Kunii Tosiyasv L研究用摄像机获得手的运动图像数据来自动分析三维手势,实现三维手势重构。1997年,加拿大多伦多大学的Sidney S F研究的Glove TalkII系统是目前最有影响的手势接口系统,他采用神经网络将用户手势转换成手势语言参数,通过语言合成器合成为语言输出。我国高文等人,也进行了基于手势和人的行为动作识别的手语合成技术的研究。\n[0003] 目前基于传感器数据手套的手势识别是从传感器直接获得手指运动特征数据,然后通过匹配的算法将其翻译成人可直接识别的文字或声音。但是目前手语翻译技术多数受限于词语的识别,并且随着手语库的增多容易造成翻译混淆,并且由于人手的大小不一,也比较容易造成不同人之间的手势识别效率差别较大,识别准确率较低。\n发明内容\n[0004] 为了解决上述技术问题,本发明的目的是提供一种能提高手势识别的准确率的一种数据手套的模糊手语识别方法。\n[0005] 本发明所采用的技术方案是:\n[0006] 一种数据手套的模糊手语识别方法,包括以下步骤:\n[0007] A、获取手部动作数据并对其进行模糊处理,得到手势帧序列;\n[0008] B、根据手语数据库和概率数据库,对得到的手势帧序列进行识别处理,得到手势帧序列识别结果。\n[0009] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述的步骤A包括:\n[0010] A1、获取手部动作数据中的各个手指的弯曲角度,并根据预设的弯曲隶属度函数,得出对应的各个手指的弯曲状态;\n[0011] A2、获取手部动作数据中的手掌俯仰角,并根据预设的俯仰隶属度函数进行计算,得出结果值最大的即为对应的俯仰状态;\n[0012] A3、获取手部动作数据中的手掌倾斜角,并根据预设的倾斜隶属度函数进行计算,得出结果值最大的即为对应的倾斜状态;\n[0013] A4、获取手部动作数据中的手掌偏航角,并根据预设的偏航隶属度函数进行计算,得出结果值最大的即为对应的偏航状态;\n[0014] A5、根据计算得到的俯仰状态、倾斜状态和偏航状态,结合预设的规则,得出对应的手掌朝向;\n[0015] A6、根据手掌朝向和各个手指的弯曲状态,得出手势帧,并进而得出手势帧序列。\n[0016] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,其特征在于:所述的步骤B包括:\n[0017] B1、获取手势帧序列,依照从头到尾的顺序提取手势帧;\n[0018] B2、将提取的手势帧分别依次放入对应的结点中;\n[0019] B3、依次从手语数据库中提取各个手势帧对应的所有字词,并将其附加进对应的结点中,直到手势帧序列上所有手势帧均完成手语数据库的检索;\n[0020] B4、将相邻两个结点所附带的字词按照结点的顺序分别两两组合,组合中由上一个结点的字词指向下一个结点的字词;\n[0021] B5、将所有组合分别在概率数据库中索引出各组合的概率;\n[0022] B6、查找出各组合组成的句子中概率和最大的一个句子,得出手势帧序列识别结果。\n[0023] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述的步骤A1中的弯曲隶属度函数为:\n[0024]\n[0025]\n[0026]\n[0027] 其中,X∈U0,U0表示手指弯曲角度,U0=[0,120],在U0上建立手指弯曲角度的三个模糊集A0表示弯曲状态为“伸直”的状态,A1=表示弯曲状态为“半弯曲”的状态,A2=表示弯曲状态为“紧握”的状态。\n[0028] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述的步骤A2中的俯仰隶属度函数为:\n[0029]\n[0030]\n[0031]\n[0032] 其中,x∈U1,U1表示手掌俯仰角,U1=[-90,90],在U1上建立俯仰角的三个模糊集B0表示俯仰角为“俯”的状态,B1=表示俯仰角为“水平”的状态,B2=表示俯仰角为“仰”的状态。\n[0033] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述的步骤A3中的倾斜隶属度函数为:\n[0034]\n[0035]\n[0036]\n[0037]\n[0038] 其中,y∈U2,U2表示手掌倾斜角,U2=[-180,180],在U2上建立倾斜角的三个模糊集C0表示倾斜角为“左倾”的状态,C1=表示倾斜角为“水平”的状态,C2=表示倾斜角为“右倾”的状态,C3=表示倾斜角为“翻转水平”的状态。\n[0039] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述的步骤A3中的偏航隶属度函数为:\n[0040]\n[0041]\n[0042]\n[0043]\n[0044] 其中,z∈U3,U3表示手掌偏航角,U3=[0,360],在U3上建立偏航角的三个模糊集D0表示偏航角为“前”的状态,D1=表示偏航角为“右”的状态,D2=表示偏航角为“后”的状态,D3=表示偏航角为“左”的状态。\n[0045] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述手语数据库以手指弯曲状态和手掌朝向形成的手势帧作为索引,手势对应的字词作为被索引的内容。\n[0046] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述概率数据库中的字词组合的概率为利用语言模型训练工具SRILM得到。\n[0047] 本发明的有益效果是:\n[0048] 本发明一种数据手套的模糊手语识别方法通过对手部动作数据进行模糊处理,有效避免了因手掌大小不一造成的识别率较低的问题,而且通过结合手语数据库和概率数据库,使得本发明能根据前后手势选取当前手势最优的识别,大大提高手势识别的准确率。\n附图说明\n[0049] 下面结合附图对本发明的具体实施方式作进一步说明:\n[0050] 图1是本发明一种数据手套的模糊手语识别方法的步骤流程图;\n[0051] 图2是本发明一种数据手套的模糊手语识别方法步骤A的步骤流程图;\n[0052] 图3是本发明一种数据手套的模糊手语识别方法步骤B的步骤流程图;\n[0053] 图4是本发明一种数据手套的模糊手语识别方法中手势帧的构成示意图。\n具体实施方式\n[0054] 参考图1,本发明一种数据手套的模糊手语识别方法,包括以下步骤:\n[0055] A、获取手部动作数据并对其进行模糊处理,得到手势帧序列;\n[0056] B、根据手语数据库和概率数据库,对得到的手势帧序列进行识别处理,得到手势帧序列识别结果。\n[0057] 参考图2,作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述的步骤A包括:\n[0058] A1、获取手部动作数据中的各个手指的弯曲角度,并根据预设的弯曲隶属度函数,得出对应的各个手指的弯曲状态;\n[0059] A2、获取手部动作数据中的手掌俯仰角,并根据预设的俯仰隶属度函数进行计算,得出结果值最大的即为对应的俯仰状态;\n[0060] A3、获取手部动作数据中的手掌倾斜角,并根据预设的倾斜隶属度函数进行计算,得出结果值最大的即为对应的倾斜状态;\n[0061] A4、获取手部动作数据中的手掌偏航角,并根据预设的偏航隶属度函数进行计算,得出结果值最大的即为对应的偏航状态;\n[0062] A5、根据计算得到的俯仰状态、倾斜状态和偏航状态,结合预设的规则,得出对应的手掌朝向;\n[0063] A6、根据手掌朝向和各个手指的弯曲状态,得出手势帧,并进而得出手势帧序列。\n[0064] 参考图3,作为所述的一种数据手套的模糊手语识别方法的进一步改进,其特征在于:所述的步骤B包括:\n[0065] B1、获取手势帧序列,依照从头到尾的顺序提取手势帧;\n[0066] B2、将提取的手势帧分别依次放入对应的结点中;\n[0067] B3、依次从手语数据库中提取各个手势帧对应的所有字词,并将其附加进对应的结点中,直到手势帧序列上所有手势帧均完成手语数据库的检索;\n[0068] B4、将相邻两个结点所附带的字词按照结点的顺序分别两两组合,组合中由上一个结点的字词指向下一个结点的字词;\n[0069] B5、将所有组合分别在概率数据库中索引出各组合的概率;\n[0070] B6、查找出各组合组成的句子中概率和最大的一个句子,得出手势帧序列识别结果。\n[0071] 比如,手势序列S有两个手势帧依次为A和B,假设手势A有字词“你”和“那”,手势B有字词“好”和“正”,假设“你好”的概率为0.0052,“你正”的概率为“0.00045”,“那好”的概率为0.0078,“那正”的概率为0.00032,则手势序列S的识别结果为概率最大的那个句子,即识别结果为“那好”。\n[0072] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述的步骤A1中的弯曲隶属度函数为:\n[0073]\n[0074]\n[0075]\n[0076] 其中,X∈U0,U0表示手指弯曲角度,U0=[0,120],在U0上建立手指弯曲角度的三个模糊集A0表示弯曲状态为“伸直”的状态,A1=表示弯曲状态为“半弯曲”的状态,A2=表示弯曲状态为“紧握”的状态。\n[0077] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述的步骤A2中的俯仰隶属度函数为:\n[0078]\n[0079]\n[0080]\n[0081] 其中,x∈U1,U1表示手掌俯仰角,U1=[-90,90],在U1上建立俯仰角的三个模糊集B0表示俯仰角为“俯”的状态,B1=表示俯仰角为“水平”的状态,B2=表示俯仰角为“仰”的状态。\n[0082] 若手掌俯仰角为42,将x=42代入公式二中的隶属度函数计算,得出B0(42)=0.1,B1(42)=0.3,B2(42)=0,B1>B0>B2,则该次输入的x值的俯仰角为水平。\n[0083] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述的步骤A3中的倾斜隶属度函数为:\n[0084]\n[0085]\n[0086]\n[0087]\n[0088] 其中,y∈U2,U2表示手掌倾斜角,U2=[-180,180],在U2上建立倾斜角的三个模糊集C0表示倾斜角为“左倾”的状态,C1=表示倾斜角为“水平”的状态,C2=表示倾斜角为“右倾”的状态,C3=表示倾斜角为“翻转水平”的状态。\n[0089] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述的步骤A3中的偏航隶属度函数为:\n[0090]\n[0091]\n[0092]\n[0093]\n[0094] 其中,z∈U3,U3表示手掌偏航角,U3=[0,360],在U3上建立偏航角的三个模糊集D0表示偏航角为“前”的状态,D1=表示偏航角为“右”的状态,D2=表示偏航角为“后”的状态,D3=表示偏航角为“左”的状态。\n[0095] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述手语数据库以手指弯曲状态和手掌朝向形成的手势帧作为索引,手势对应的字词作为被索引的内容。\n[0096] 作为所述的一种数据手套的模糊手语识别方法的进一步改进,所述概率数据库中的字词组合的概率为利用语言模型训练工具SRILM得到。\n[0097] 参考图4,其中,本发明中的一个手势帧序列是指一个完整的手语句子,包含N个手势帧。一个手势帧是由4个字节(32位)组成,其中第32位保留,第26~30位和第11~15位分别为左手和右手的“手掌朝向”状态,第16~25位和第1位~第10位分别为存储左手和右手的手指弯曲状态,其中一个手指弯曲状态占2个位,拇指、食指、中指、无名指和小指分别从高位到低位排序,第0位为校验位。\n[0098] 手语帧序列是由多个手语帧按时间顺序进行排列的,一个手语帧对应多个字或词,因为一个手势在不同的语境景代表着不同的意思,并且在本方法中已经对手势进行了抽象,使一些只有轻微差别的手势抽象成相同的手语帧。而手势识别部分就是将手语帧序列中的手语帧根据上下文的统计概率将最合适的字词提取出来并与手语帧序列中的其他手语帧形成最理想的句子。\n[0099] 手语识别之前必须建立好手语数据库和概率数据库。\n[0100] 手语数据库的建立是指参照《中国手语》上下册,将里面的内容利用第一部分介绍方法提出去手指的弯曲状态和手掌的朝向状态并形成手语帧,并以这个4个字节(32位)的手语帧作为索引,而手势对应的字词作为被索引的内容,相同的手势对应的字词放在一个索引下,当以该索引搜索时,将引出该索引的全部内容。如:“你”和“那”的手势是一样的,则它们的索引是一样的,假设该索引为A,搜索A时将引出“你”,“那”。\n[0101] 概率数据库是指字词在语料库中单个字词的出现的频率,以及每一个词后面跟着出现另一个词的频率的集合;所谓的语料库是指手语方面日常用语句子或文章。对于单个字词和一个词跟住出现另一个词的概率的则是利用语言模型训练工具SRILM得到。并将它们以下面的格式来存储。以字词或字词组合索引出该字词或字词组合的概率,如“绿叶”索引出概率为0.000000147332,以“至于”“外貌”索引出概率“0.000145517086”。概率数据库的索引是以两个词为基础,如果在\2-gram\中找不到这两个词的组合,则在\1-gram\分别找到这两个词单独的概率,设为P1和P2,则该两个词的组合概率为P=P1*P2*e,e为自然常数约2.71828182845905。\n[0102] 以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
法律信息
- 2019-03-01
专利权的转移
登记生效日: 2019.02.11
专利权人由广州畅途软件有限公司变更为东莞市易联交互信息科技有限责任公司
地址由510663 广东省广州市高新技术产业开发区彩频路9号801C,801D变更为523808 广东省东莞市松山湖高新技术产业开发区新城路大学创新城D-1栋2楼224室
- 2017-10-10
- 2015-04-01
实质审查的生效
IPC(主分类): G06K 9/52
专利申请号: 201410655579.5
申请日: 2014.11.17
- 2015-03-04
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| | 暂无 |
1996-11-27
| | |
2
| |
2011-09-21
|
2011-05-25
| | |
3
| |
2013-09-18
|
2013-05-31
| | |
4
| |
2013-06-26
|
2013-02-07
| | |
5
| |
2014-01-01
|
2013-09-06
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |