首页专利查询专利详情

*来源于国家知识产权局数据，仅供参考，实际以国家知识产权局展示为准

汽车驾驶员语音助手

发明专利有效专利

申请号：
CN201410435118.7
IPC分类号：G10L15/26B60W50/00
申请日期：
2014-08-30
申请人：
长城汽车股份有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	汽车驾驶员语音助手
申请号	CN201410435118.7	申请日期	2014-08-30
法律状态	授权	申报国家	中国
公开/公告日	2014-12-10	公开/公告号	CN104200805A
优先权	暂无	优先权号	暂无
主分类号	G10L15/26 ? IPC结构图谱： G 物理 G0 仪器 G10 乐器；声学 G10L 语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码〔4〕 G10L15/00 语音识别（G10L 17/00优先）〔7，2013.01〕 G10L15/26 语音—正文识别系统（G10L 15/08优先）〔7〕	IPC分类号	G10L15/26;B60W50/00查看分类表>
申请人	长城汽车股份有限公司	申请人地址	河北省保定市朝阳南大街22*** 变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	长城汽车股份有限公司	当前权利人	长城汽车股份有限公司
发明人	薛明明;樊鸿杰;温超
代理机构	石家庄冀科专利商标事务所有限公司	代理人	李羡民;高锡明

摘要

一种汽车驾驶员语音助手，构成中包括智能控制器及与智能控制器相连的拾音单元和执行单元，所述智能控制器内设置有声纹识别模块、语音命令存储模块和指令生成模块，指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较，若找到与之匹配的语音命令，则控制执行单元执行该语音命令所对应的操作；声纹识别模块对拾音单元输出的语音信号进行声纹识别并控制指令生成模块的使能端，只有判断该语音信号为驾驶员所发时，才允许指令生成模块输出信号。本发明利用声纹识别技术识别说话人的身份，防止驾驶员以外的人员利用语音命令操控汽车，在保证行车安全的同时，简化了驾驶员的操作，提高了驾车舒适性。

一种激光打火机及控制方法（高校光电）

发明授权

立即咨询

一种水利工程生态护坡支撑结构

实用新型

立即咨询

一种腿部骨折复位机

发明授权

立即咨询

一种抗菌防臭面料

实用新型

立即咨询

一种用于铝箔复合纸加工用剥离设备

实用新型

立即咨询

一种中空玻璃生产用快速注胶装置

实用新型

立即咨询

一种龙门铣床防护结构

实用新型

立即咨询

一种油墨印刷辊用清洁装置

实用新型

立即咨询

一种建筑模板清理装置

实用新型

立即咨询

一种机械配件钻孔设备

实用新型

立即咨询

一种农产品加工用切丝机

实用新型

立即咨询

一种用于粮食加工的可调节倾斜角度的清理筛

实用新型

立即咨询

多种安装方式的投影仪（多媒体，影视，教学培训，展厅，会展）

实用新型

立即咨询

一种远距离调节式中频治疗仪医学

实用新型

立即咨询

一种自适应式颈椎枕头

实用新型

立即咨询

一种便于叠放的光伏板生产用储存装置（太阳能光伏发电，光伏板生产）

实用新型

立即咨询

一种具有翻转功能的光伏板生产用切割设备（太阳能光伏发电，光伏板生产）

实用新型

立即咨询

一种自恒压型阀门（石油化工饮料制药天然气）

实用新型

立即咨询

一种建筑施工浇筑模板

实用新型

立即咨询

一种塑料波纹管生产用搅拌机

实用新型

立即咨询

汽车驾驶员语音助手
技术领域
[0001] 本发明涉及一种可通过汽车驾驶员的语音命令对汽车进行操控的装置，属于汽车技术领域。
背景技术
[0002] 近几年来，语音识别技术有了较大的突破，已经出现了较为成熟的商用化的语音助手，如苹果公司的Siri，谷歌公司的Google Now,微软公司的Cortana等。而在国内，各种语音助手也是层出不穷，如智能360、小i机器人、虫洞和灵犀等，为各种设备和装置的人机交互提供了便利条件。
[0003] 然而在汽车上，人机交互还是通过旋钮、按键及触屏来实现的，驾驶员还不能用自然语言直接发出各种操控命令。其主要原因是现有的语音识别系统还不能足够准确地识别说话人的身份，不能准确无误地区分驾驶员与乘客发出的语音信号，如果对乘客发出的与行车安全密切相关的语音操作命令（如加速、制动等），汽车控制系统也会执行，就很容易引发交通事故，给驾驶员、乘客和行人的安全造成极大的威胁，这是绝对不允许的。
发明内容
[0004] 本发明的目的在于针对现有技术之弊端，提供一种高可靠性的汽车驾驶员语音助手，在保证行车安全的同时，简化驾驶员的操作。
[0005] 本发明所述问题是以下述技术方案解决的：
[0006] 一种汽车驾驶员语音助手，构成中包括智能控制器及与智能控制器相连的拾音单元和执行单元，所述智能控制器内设置有声纹识别模块、语音命令存储模块和指令生成模块，指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较，若找到与之匹配的语音命令，则控制执行单元执行该语音命令所对应的操作；声纹识别模块对拾音单元输出的语音信号进行声纹识别并控制指令生成模块的使能端，只有判断该语音信号为驾驶员所发时，才允许指令生成模块输出信号。
[0007] 上述汽车驾驶员语音助手，所述拾音单元包括三个麦克风，它们安装在驾驶室内的不同位置且与驾驶员头部距离相等，所述智能控制器内设置有相位比较模块，所述相位比较模块将三个麦克风所采集的语音信号的相位进行比较并控制指令生成模块的使能端，只有任意两个麦克风所输出的信号之间的相位差均小于设定的阈值时，才允许指令生成模块输出信号。
[0008] 上述汽车驾驶员语音助手，所述指令生成模块将拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令进行比较的方法如下：
[0009] 用n维向量表示拾音单元采集到的语音信号，用n维向量
表示存储的语音命令，用下式计算二者之间的相似度距离：
[0010]
[0011] 其中，ED为欧几里得距离：，为向量各维差值的和的绝对
值：，SAD为曼哈顿距离：，式中（，
）是n 维向量各维的权值系数，
[0012] 若相似度距离小于设定的阈值，则认为拾音单元采集到的语音信号与预存于语音命令存储模块中的语音命令匹配。
[0013] 上述汽车驾驶员语音助手，所述声纹识别模块和相位比较模块的输出信号经与门与指令生成模块的使能端连接。
[0014] 上述汽车驾驶员语音助手，三个麦克风应位于一个共圆内。
[0015] 上述汽车驾驶员语音助手，三个麦克风之间的距离相等。
[0016] 本发明利用声纹识别技术识别说话人的身份，防止驾驶员以外的人员利用语音命令操控汽车，在保证行车安全的同时，简化了驾驶员的操作，提高了驾车舒适性。三个麦克风不仅可以采集声音信号，还可用于判断声源位置，保证说话人身份识别的准确性。
附图说明
[0017] 下面结合附图对本发明作进一步详述。
[0018] 图1是本发明的电原理框图；
[0019] 图2是三个麦克风的安装示意图。
[0020] 图2中各符号为：H、驾驶员头部位置，a、b、c分别为三个麦克风的安装位置。
具体实施方式
[0021] 声纹识别（Voiceprint Recognition，VR），即说话人的音色（或称声纹）识别（Speaker RecognitionSR），它与指纹识别技术一样，属于生物特征识别技术的一种，是一项根据语音波形中反映声纹生理和行为特征的语音参数，自动识别声纹身份的技术。与语音识别不同的是，声纹识别不考虑语音中的字词意思，它强调声纹的个性；而语音识别的目的是识别出语音信号的内容，并不考虑声纹是谁，强调声纹的共性。
[0022] 近年来，在生物识别技术领域中，声纹识别技术因具有独特的方便性、经济性和准确性等优势而受到世人瞩目，并逐渐成为人们日常生活和工作中重要且普及的身份识别方法。通过声纹识别技术实现身份识别的过程包括：首先从输入的语音信号中提取能够反映说话人是谁的特征；然后根据该特征进行模式匹配，确定说话人的身份。然而声纹识别的特征相似时，也会将特征相似的其他人误识别为预识别人员。因此，要想准确识别说话人的身份，还需要采取其它辅助措施。
[0023] 参看图1和图2，本发明采用声纹识别与说话人位置识别相结合的方法，保证了身份识别的准确性。
[0024] 位置识别原理：
[0025] 参看图2，三个麦克风安装在车内不同位置，它们到驾驶员头部的距离相同，由于驾驶员的语音传到三个麦克风的时间相同，因此当驾驶员说话时，三个麦克风所采集的语音信号的相位基本相同，而其他乘员说话时，三个麦克风所采集的语音信号的相位会有较大差别。智能控制器根据这一原理就可识别语音信号是否来自驾驶员。
[0026] 一般人的语音频率都在1kH左右，根据声音在空气中的传播速度计算可知，语音的波长大概在30cm左右，驾驶员开车时，其头部晃动范围较小，对麦克风接收的声音信号的相位影响不大，不会影响检测精度。
[0027] 为了保证其他乘员的头部到三个麦克风的距离不同，三个麦克风的高度差应尽量小，使经过三个麦克风的圆的轴线基本与水平面垂直。由于只有该轴线上的点到三个麦克风的距离才相等，而其他乘员的头部不会在该轴线上，这样就保证了检测精度。
[0028] 本发明使用前，需先将驾驶员的声纹信息和各种语音命令存储在智能控制器中，存储的方法与传统方法相同，这里不再叙述。
[0029] 本发明的工作过程：
[0030] 三个麦克风采集的声音信号进入智能控制器后，首先由模数转换器转换为数字信号，然后分成三路，分别进入声纹识别模块、相位比较模块和指令生成模块，声纹识别模块根据其声纹信息库内存储的声纹信息对信号进行声纹识别，相位比较模块根据三个信号的相位差判断语音信号是否来自于驾驶员，声纹识别模块和相位比较模块的输出信号经与门接入指令生成模块的使能端，只有当两模块均判断语音信号来自于驾驶员时，才允许指令生成模块输出指令信号。指令生成模块将接收的语音信号与语音命令存储模块中存储的语音命令相比较，若找到匹配的语音命令，则向执行单元输出相应的指令信号，否则执行单元不输出信号。
[0031] 司机在第一次驾驶汽车时，首先需要智能控制器对其进行语音学习，即将汽车操控的命令输入，并存储在语音命令存储模块中，以后即作为具体操控命令的比较基准。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN101488190A	2009-07-22	2009-02-27	一种向量间相似度的计算方法无效专利	华北电力大学(保定)
2	CN102930868A	2013-02-13	2012-10-24	身份识别方法和装置无效专利	北京车音网科技有限公司
3	CN103448632A	2013-12-18	2012-05-28	汽车控制方法及装置有效专利	百度在线网络技术(北京)有限公司
4	CN103811004A	2014-05-21	2012-11-15	船舶主动力语音控制方法及系统无效专利	上海船舶运输科学研究所
5	CN102033223A	2011-04-27	2010-12-29	使用麦克风阵列对声源定位的方法失效专利	北京信息科技大学
6	CN102582576A	2012-07-18	2012-03-15	基于声音识别技术的车辆防盗和人身安全保护系统无效专利	福州海景科技开发有限公司