著录项信息
专利名称 | 一种数据手套动态手语识别方法 |
申请号 | CN201110137703.5 | 申请日期 | 2011-05-25 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2011-09-21 | 公开/公告号 | CN102193633A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F3/01 | IPC分类号 | G;0;6;F;3;/;0;1查看分类表>
|
申请人 | 广州畅途软件有限公司 | 申请人地址 | 广东省广州市越秀区水荫路119号“星光映景”17层01室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 广州幻境科技有限公司 | 当前权利人 | 广州幻境科技有限公司 |
发明人 | 黄昌正;王兵;郝志锋 |
代理机构 | 广州嘉权专利商标事务所有限公司 | 代理人 | 谭英强 |
摘要
本发明公开了一种数据手套动态手语识别方法,包括手语识别之前建立手语数据库和手语识别两个部分,所述手语识别的步骤如下:输入代表手指运动的特征值;将输入的特征值与储存于手语数据库中的特征值进一次以上的匹配;将匹配得到的结果转化成相应可识别的输出信号送给输出终端。所述手语数据库为将传感器检测的角度值转化为手语特征的特征值的集合,所述输入的特征值为来自传感器检测的角度值。本发明提高了手语识别匹配的效率和精度;本发明通过在匹配流程中仅保留最后匹配的结果,节省了手语识别匹配过程中的资源消耗。可广泛应用在手语识别领域。
1.一种数据手套动态手语识别方法,包括手语识别之前建立手语数据库和手语识别两个部分,所述手语识别的步骤如下:
S1.输入代表手指运动的特征值;
S2.将输入的特征值与储存于手语数据库中的特征值进一次以上的匹配;
S3.将匹配得到的结果转化成相应可识别的输出信号送给输出终端;
其特征在于:所述手语数据库为将传感器检测的角度值转化为手语特征的特征值的集合,所述手语数据库的特征值由每只手指的弯曲角度范围和手掌与水平面的夹角范围构成,每个特征值对应有文字标识,带文字标识的特征值按预定义的先后顺序组成一个代表手势语的序列;所述输入的特征值为来自传感器检测的角度值,所述输入的特征值由每只手指的弯曲角度范围和手掌与水平面的夹角范围构成,所述输入的特征值按动作先后顺序组成输入序列。
2.根据权利要求1所述的一种数据手套动态手语识别方法,其特征在于:所述代表手势语的序列按识别频率高低为序构成手语数据库。
3.根据权利要求1所述的一种数据手套动态手语识别方法,其特征在于:所述步骤S2中匹配的具体流程如下:
S21.将输入的第一特征值与数据库中代表手势语的序列中的第一特征值进行匹配;
S22.保存匹配结果,判断等待下一次特征值输入的时间是否超时;
S23.若输入超时,则输出最佳匹配结果并结束匹配;
S24.若输入不超时,接收输入的特征值,将输入的特征值与上一次保存的匹配结果中序列内相应特征值进行匹配;
S25.若匹配成功,则删除上一次保存的匹配结果,返回S22;
S26.若匹配不成功,则输出上次保存的匹配结果中的最佳匹配结果,并结束匹配。
4.根据权利要求1所述的一种数据手套动态手语识别方法,其特征在于:所述输出信号为文字、图片或者语音。
一种数据手套动态手语识别方法\n技术领域\n[0001] 本发明涉及一种人工智能领域的模式识别方法,尤其是一种数据手套动态手语识别方法。\n背景技术\n[0002] 目前的手势识别分为两种,一种是基于传感器数据的手势识别方法,一种是基于图像识别的手势识别方法。\n[0003] 基于物理手套传感器数据的手势识别是从传感器直接获得手指运动特征数据,通过一定的算法将其翻译成人可直接识别的文字或声音;基于图像识别的手势识别方法是通过图像录入设备把手形输入到计算机当中,借助图像处理技术进行手势识别的方法。\n[0004] 国内外科学家对手势识别进行了大量研究。1994年,Ramon M S 和Dannil T 研制了一种基于物理约束的手抓取过程的手动作合成的控制与抓取系统。1995年,Lee J intae 和Kunii Tosiyasv L 研究用摄像机获得手的运动图像数据来自动分析三维手势,实现三维手势重构。1997年,加拿大多伦多大学的Sidney S F 研究的Glove TalkII系统是目前最有影响的手势接口系统,他采用神经网络将用户手势转换成手势语言参数,通过语言合成器合成为语言输出。我国高文等人,也进行了基于手势和人的行为动作识别的手语合成技术的研究。\n[0005] 但对于基于图像识别的手势识别方法,依赖于摄像机成像,环境,光线等因素,由于人手在运动过程当中,必然会使手指遮掩而使摄像机摄不到要分析的手指图像。考虑到现有的条件因素,本研究基于传感器数据手套的手势识别。\n[0006] 国内机构对基于传感器数据手套的手势识别技术也已有了起步,2010年华南理工大学的一种基于加速度传感器的手势识别方法,这种方法是基于数据手套上的加速度传感器,以获得手指运动特征值,主要是通过加速度值获得手指在空间的旋转特征码,然后能过一定的算法去除人手抖动产生的噪声,而获得的特征值。这种技术因为基于加速度传感器,由于加速度传感器本身精度,使得特征值精度有限,加速度传感器依靠运动或重力产生加速度分量,使得加速度传感器受外界影响较大,如手指运动过程当中,快慢产生的加速度值不一样,不能表达加速度传感器当前的位置,外界有振动,如有汽车经过,飞机起飞,音响等环境时,传感器的数据很不稳定。\n发明内容\n[0007] 本发明要解决的技术问题是:提供一种高精度的数据手套手语识别方法,所述手语识别方法节省匹配存储空间和耗时,识别效率高。\n[0008] 为了解决上述技术问题,本发明所采用的技术方案是:\n[0009] 一种数据手套动态手语识别方法,包括手语识别之前建立手语数据库和手语识别两个部分,所述手语识别的步骤如下:\n[0010] S1.输入代表手指运动的特征值;\n[0011] S2.将输入的特征值与储存于手语数据库中的特征值进一次以上的匹配;\n[0012] S3.将匹配得到的结果转化成相应可识别的输出信号送给输出终端;\n[0013] 所述手语数据库为将传感器检测的角度值转化为手语特征的特征值的集合,所述输入的特征值为来自传感器检测的角度值。\n[0014] 进一步作为优选的实施方式,所述数据库特征值由每只手指的弯曲角度范围和手掌与水平面的夹角范围构成,每个特征值对应有文字标识,带文字标识的特征值按预定义的先后顺序组成一个代表手势语的序列。\n[0015] 进一步作为优选的实施方式,所述序列按识别频率高低为序构成手语数据库。\n[0016] 进一步作为优选的实施方式,所述输入的特征值由每只手指的弯曲角度范围和手掌与水平面的夹角范围构成,所述特征值按动作先后顺序组成输入序列。\n[0017] 进一步作为优选的实施方式,所述步骤S2中匹配的具体流程如下:\n[0018] S21.将输入的第一特征值与数据库中代表手势语的序列中的第一特征值进行匹配;\n[0019] S22.保存匹配结果,判断等待下一次特征值输入的时间是否超时;\n[0020] S23.若输入超时,则输出最佳匹配结果并结束匹配;\n[0021] S24.若输入不超时,接收输入的特征值,将输入的特征值与上一次保存的匹配结果中序列内相应特征值进行匹配;\n[0022] S25.若匹配成功,则删除上一次保存的匹配结果,返回S22;\n[0023] S26.若匹配不成功,则输出上次保存的匹配结果中的最佳匹配结果,并结束匹配。\n[0024] 进一步作为优选的实施方式,所述输出信号为文字、图片或者语音。\n[0025] 本发明的有益效果是:本发明通过以各手指的弯曲角度范围和手掌与水平面的夹角范围构成特征值,将特征值按预定义的语义构成序列组成手语特征数据库,并以被包含的匹配方式对动作的关键帧特征值进行匹配,提高了匹配的效率和精度;本发明通过在匹配流程中仅保留最后匹配的结果,节省了手语识别匹配过程中的资源消耗。\n附图说明\n[0026] 下面结合附图对本发明的具体实施方式作进一步说明:\n[0027] 图1是本发明手语识别方法的流程图;\n[0028] 图2是本发明手语数据库中代表手势语的序列的组成图;\n[0029] 图3是本发明手语识别方法输入特征值与数据库特征值匹配的流程图。\n具体实施方式\n[0030] 本发明旨在对人手指的变化所表达的内容遵照人设计的意图,按动作对应的关键帧顺序,给出最接近的表达结果。下面结合附图对本发明进行进一步的说明:\n[0031] 本发明所述输入特征值为双手的各个手指的弯曲角度和手掌所在平面与水平面成的夹角。本发明采用5个弯曲传感器分布在每个手指的第二个关节处,并与指平面贴近,平行。加速度传感器位于手背心部,与手掌平面平行。弯曲传感器获得反映手指弯曲程度的角度值,加速度传感器获得当前手掌所指示的方向。本发明根据这这两种传感器所获得的角度和加速度,通过加速度值在X、Y、Z三个方向的分量比值,Angle(x)=x/sqrt(x*x+y*y+z*z), Angle(y)=y/sqrt(x*x+y*y+z*z)\n[0032] ,Angle(z)=z/sqrt(x*x+y*y+z*z)分别求出加速度传感器面的方向。把这些角度组织在一起,形成了一个以角度为特征值的数据结构,每一个特定的手势都对应着一组特定的角度。动态手势对应着一系列的组角度。\n[0033] 所述手语特征数据库的建立方法如下:\n[0034] 建立一个以每只手的手指弯曲角度范围和其手掌与水平面的夹角范围组成一个特征值;\n[0035] 每个特征值都有其对应的文字标识;\n[0036] 每个带有文字标识的特征值按用户定义的先后顺序组成一个序列,称这个序列为一个手势语。\n[0037] 每个手势语都有一个文字标识,以“你们好”为例来说明:这个手势语由三个序列组成。分别为序列1“你”序列2“们”序列3“好”组成。其中“你”“们”“好”依次为序列的文字标识。而“你们好”为手势语的文字标识。序列“你”是由每个手指的弯曲最大角度和最小角度,手掌的水平角度和法向角度构成其的特征值。参照图2,手语特征数据内序列的结构包括多个特征值:特征值1,特征值2,特征值3,特征值n……。\n[0038] 以手势语为基本元素,构建一个按识别频率高为顺序的自定义数据库。\n[0039] 至此,手语特征数据库建立完成。\n[0040] 建立好手势语库之后,参照图1,手语识别步聚如下:\n[0041] S1.输入代表手指运动的特征值;\n[0042] S2.将输入的特征值与储存于手语数据库中的特征值进一次以上的匹配;\n[0043] S3.将匹配得到的结果转化成相应可识别的输出信号送给输出终端。\n[0044] 参照图3,匹配的具体流程如下:\n[0045] S21.将输入的第一特征值与数据库中代表手势语的序列中的第一特征值进行匹配;\n[0046] S22.保存匹配结果,判断等待下一次特征值输入的时间是否超时;\n[0047] S23.若输入超时,则输出最佳匹配结果并结束匹配;\n[0048] S24.若输入不超时,接收输入的特征值,将输入的特征值与上一次保存的匹配结果中序列内相应特征值进行匹配;\n[0049] S25.若匹配成功,则删除上一次保存的匹配结果,返回步骤S22;\n[0050] S26.若匹配不成功,则输出上次保存的匹配结果中的最佳匹配结果,并结束匹配。\n[0051] 当输入的手势语包括多帧特征值时,需要按手势语的动作依次匹配每个特征值。\n这里有种情况,即在比较过程当中有多个符合条件的手势语序列,如:你好,你好吗?你好多书。当进行第一个特征值时,这三个序列都符合,如果在给定的时间内(假如2秒内无数据输入,那么没有手势被识别,如果有数据输入,且恰好是“好”特征值,那么这3个也都符合,这时在给定的时间内没有数据输入,就以“你好”做为输出结果。如果有数据输入,且符合序列3,就以序列3所在的手势语作为结果,否则以“你好”作为结果输出。\n[0052] 以上是对本发明的较佳实施进行了具体说明,但本发明创造并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。
法律信息
- 2016-12-28
专利权的转移
登记生效日: 2016.12.05
专利权人由广州畅途软件有限公司变更为广州幻境科技有限公司
地址由510663 广东省广州市高新技术产业开发区彩频路9号(B栋)801C、801D变更为510075 广东省广州市越秀区水荫路119号“星光映景”17层01室
- 2012-12-12
- 2011-11-23
实质审查的生效
IPC(主分类): G06F 3/01
专利申请号: 201110137703.5
申请日: 2011.05.25
- 2011-09-21
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |