著录项信息
专利名称 | 汽车驾驶员语音助手 |
申请号 | CN201410435118.7 | 申请日期 | 2014-08-30 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2014-12-10 | 公开/公告号 | CN104200805A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G10L15/26 | IPC分类号 | G;1;0;L;1;5;/;2;6;;;B;6;0;W;5;0;/;0;0查看分类表>
|
申请人 | 长城汽车股份有限公司 | 申请人地址 | 河北省保定市朝阳南大街2266号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 长城汽车股份有限公司 | 当前权利人 | 长城汽车股份有限公司 |
发明人 | 薛明明;樊鸿杰;温超 |
代理机构 | 石家庄冀科专利商标事务所有限公司 | 代理人 | 李羡民;高锡明 |
摘要
一种汽车驾驶员语音助手,构成中包括智能控制器及与智能控制器相连的拾音单元和执行单元,所述智能控制器内设置有声纹识别模块、语音命令存储模块和指令生成模块,指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较,若找到与之匹配的语音命令,则控制执行单元执行该语音命令所对应的操作;声纹识别模块对拾音单元输出的语音信号进行声纹识别并控制指令生成模块的使能端,只有判断该语音信号为驾驶员所发时,才允许指令生成模块输出信号。本发明利用声纹识别技术识别说话人的身份,防止驾驶员以外的人员利用语音命令操控汽车,在保证行车安全的同时,简化了驾驶员的操作,提高了驾车舒适性。
汽车驾驶员语音助手\n技术领域\n[0001] 本发明涉及一种可通过汽车驾驶员的语音命令对汽车进行操控的装置,属于汽车技术领域。\n背景技术\n[0002] 近几年来,语音识别技术有了较大的突破,已经出现了较为成熟的商用化的语音助手,如苹果公司的Siri,谷歌公司的Google Now,微软公司的Cortana等。而在国内,各种语音助手也是层出不穷,如智能360、小i机器人、虫洞和灵犀等,为各种设备和装置的人机交互提供了便利条件。\n[0003] 然而在汽车上,人机交互还是通过旋钮、按键及触屏来实现的,驾驶员还不能用自然语言直接发出各种操控命令。其主要原因是现有的语音识别系统还不能足够准确地识别说话人的身份,不能准确无误地区分驾驶员与乘客发出的语音信号,如果对乘客发出的与行车安全密切相关的语音操作命令(如加速、制动等),汽车控制系统也会执行,就很容易引发交通事故,给驾驶员、乘客和行人的安全造成极大的威胁,这是绝对不允许的。\n发明内容\n[0004] 本发明的目的在于针对现有技术之弊端,提供一种高可靠性的汽车驾驶员语音助手,在保证行车安全的同时,简化驾驶员的操作。\n[0005] 本发明所述问题是以下述技术方案解决的:\n[0006] 一种汽车驾驶员语音助手,构成中包括智能控制器及与智能控制器相连的拾音单元和执行单元,所述智能控制器内设置有声纹识别模块、语音命令存储模块和指令生成模块,指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较,若找到与之匹配的语音命令,则控制执行单元执行该语音命令所对应的操作;声纹识别模块对拾音单元输出的语音信号进行声纹识别并控制指令生成模块的使能端,只有判断该语音信号为驾驶员所发时,才允许指令生成模块输出信号。\n[0007] 上述汽车驾驶员语音助手,所述拾音单元包括三个麦克风,它们安装在驾驶室内的不同位置且与驾驶员头部距离相等,所述智能控制器内设置有相位比较模块,所述相位比较模块将三个麦克风所采集的语音信号的相位进行比较并控制指令生成模块的使能端,只有任意两个麦克风所输出的信号之间的相位差均小于设定的阈值时,才允许指令生成模块输出信号。\n[0008] 上述汽车驾驶员语音助手,所述指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较的方法如下:\n[0009] 用n维向量 表示拾音单元采集到的语音信号,用n维向量\n表示存储的语音命令,用下式计算二者之间的相似度距离:\n[0010]\n[0011] 其中,ED为欧几里得距离: , 为向量各维差值的和的绝对\n值: ,SAD为曼哈顿距离: ,式中 ( ,\n)是n 维向量各维的权值系数,\n[0012] 若相似度距离 小于设定的阈值,则认为拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令匹配。\n[0013] 上述汽车驾驶员语音助手,所述声纹识别模块和相位比较模块的输出信号经与门与指令生成模块的使能端连接。\n[0014] 上述汽车驾驶员语音助手,三个麦克风应位于一个共圆内。\n[0015] 上述汽车驾驶员语音助手,三个麦克风之间的距离相等。\n[0016] 本发明利用声纹识别技术识别说话人的身份,防止驾驶员以外的人员利用语音命令操控汽车,在保证行车安全的同时,简化了驾驶员的操作,提高了驾车舒适性。三个麦克风不仅可以采集声音信号,还可用于判断声源位置,保证说话人身份识别的准确性。\n附图说明\n[0017] 下面结合附图对本发明作进一步详述。\n[0018] 图1是本发明的电原理框图;\n[0019] 图2是三个麦克风的安装示意图。\n[0020] 图2中各符号为:H、驾驶员头部位置,a、b、c分别为三个麦克风的安装位置。\n具体实施方式\n[0021] 声纹识别(Voiceprint Recognition,VR),即说话人的音色(或称声纹)识别(Speaker RecognitionSR),它与指纹识别技术一样,属于生物特征识别技术的一种,是一项根据语音波形中反映声纹生理和行为特征的语音参数,自动识别声纹身份的技术。与语音识别不同的是,声纹识别不考虑语音中的字词意思,它强调声纹的个性;而语音识别的目的是识别出语音信号的内容,并不考虑声纹是谁,强调声纹的共性。\n[0022] 近年来,在生物识别技术领域中,声纹识别技术因具有独特的方便性、经济性和准确性等优势而受到世人瞩目,并逐渐成为人们日常生活和工作中重要且普及的身份识别方法。通过声纹识别技术实现身份识别的过程包括:首先从输入的语音信号中提取能够反映说话人是谁的特征;然后根据该特征进行模式匹配,确定说话人的身份。然而声纹识别的特征相似时,也会将特征相似的其他人误识别为预识别人员。因此,要想准确识别说话人的身份,还需要采取其它辅助措施。\n[0023] 参看图1和图2,本发明采用声纹识别与说话人位置识别相结合的方法,保证了身份识别的准确性。\n[0024] 位置识别原理:\n[0025] 参看图2,三个麦克风安装在车内不同位置,它们到驾驶员头部的距离相同,由于驾驶员的语音传到三个麦克风的时间相同,因此当驾驶员说话时,三个麦克风所采集的语音信号的相位基本相同,而其他乘员说话时,三个麦克风所采集的语音信号的相位会有较大差别。智能控制器根据这一原理就可识别语音信号是否来自驾驶员。\n[0026] 一般人的语音频率都在1kH左右,根据声音在空气中的传播速度计算可知,语音的波长大概在30cm左右,驾驶员开车时,其头部晃动范围较小,对麦克风接收的声音信号的相位影响不大,不会影响检测精度。\n[0027] 为了保证其他乘员的头部到三个麦克风的距离不同,三个麦克风的高度差应尽量小,使经过三个麦克风的圆的轴线基本与水平面垂直。由于只有该轴线上的点到三个麦克风的距离才相等,而其他乘员的头部不会在该轴线上,这样就保证了检测精度。\n[0028] 本发明使用前,需先将驾驶员的声纹信息和各种语音命令存储在智能控制器中,存储的方法与传统方法相同,这里不再叙述。\n[0029] 本发明的工作过程:\n[0030] 三个麦克风采集的声音信号进入智能控制器后,首先由模数转换器转换为数字信号,然后分成三路,分别进入声纹识别模块、相位比较模块和指令生成模块,声纹识别模块根据其声纹信息库内存储的声纹信息对信号进行声纹识别,相位比较模块根据三个信号的相位差判断语音信号是否来自于驾驶员,声纹识别模块和相位比较模块的输出信号经与门接入指令生成模块的使能端,只有当两模块均判断语音信号来自于驾驶员时,才允许指令生成模块输出指令信号。指令生成模块将接收的语音信号与语音命令存储模块中存储的语音命令相比较,若找到匹配的语音命令,则向执行单元输出相应的指令信号,否则执行单元不输出信号。\n[0031] 司机在第一次驾驶汽车时,首先需要智能控制器对其进行语音学习,即将汽车操控的命令输入,并存储在语音命令存储模块中,以后即作为具体操控命令的比较基准。
法律信息
- 2018-01-19
- 2015-01-07
实质审查的生效
IPC(主分类): G10L 15/26
专利申请号: 201410435118.7
申请日: 2014.08.30
- 2014-12-10
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2009-07-22
|
2009-02-27
| | |
2
| |
2013-02-13
|
2012-10-24
| | |
3
| |
2013-12-18
|
2012-05-28
| | |
4
| |
2014-05-21
|
2012-11-15
| | |
5
| |
2011-04-27
|
2010-12-29
| | |
6
| |
2012-07-18
|
2012-03-15
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |