著录项信息
专利名称 | 一种语音识别系统和方法 |
申请号 | CN201210290828.6 | 申请日期 | 2012-08-15 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2012-12-12 | 公开/公告号 | CN102820032A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G10L15/26 | IPC分类号 | G;1;0;L;1;5;/;2;6;;;G;1;0;L;1;5;/;0;2查看分类表>
|
申请人 | 歌尔声学股份有限公司 | 申请人地址 | 山东省潍坊市高新技术产业开发区东方路268号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 歌尔股份有限公司 | 当前权利人 | 歌尔股份有限公司 |
发明人 | 王平平;郄勇 |
代理机构 | 北京市隆安律师事务所 | 代理人 | 权鲜枝;何立春 |
摘要
本发明公开了一种语音识别系统和方法。其中语音识别系统包括:麦克风阵列,接收语音信号并转换成模拟音频信号后输出给音频编码电路;音频编码电路,用于将所接收的模拟音频信号转换成数字音频信号后输出给主控集成电路;蓝牙发射模块,用于接收语音信号并转换成数字音频信号后通过蓝牙方式发送给蓝牙接收模块;蓝牙接收模块,用于将所接收的数字音频信号发送给主控集成电路;主控集成电路,用于选择来自音频编码电路的数字音频信号或来自蓝牙接收模块的数字音频信号进行语音识别处理。本发明的技术方案解决了只有麦克风阵列作为音频输入的语音识别系统无法对远距离语音进行识别的问题。
1.一种语音识别系统,其特征在于,包括:麦克风阵列、音频编码电路、主控集成电路、蓝牙接收模块和蓝牙发射模块,其中:
麦克风阵列,用于接收近距离的语音信号并转换成模拟音频信号后输出给音频编码电路;
音频编码电路,用于将所接收的模拟音频信号转换成数字音频信号后输出给主控集成电路;
蓝牙发射模块,用于接收远距离的语音信号并转换成数字音频信号后通过蓝牙方式发送给蓝牙接收模块;
蓝牙接收模块,用于将所接收的数字音频信号发送给主控集成电路;
主控集成电路,用于选择来自音频编码电路的数字音频信号或来自蓝牙接收模块的数字音频信号进行语音识别处理;
所述主控集成电路具有按键,主控集成电路根据用户对该按键的操作选择来自音频编码电路的数字音频信号或来自蓝牙接收模块的数字音频信号进行语音识别处理;或者,该语音识别系统还包括系统主控微控制单元,用于接收来自主控集成电路的音频数据流;该系统主控微控制单元具有按键,系统主控微控制单元根据用户对该按键的操作向主控集成电路发送选择来自音频编码电路的数字音频信号的指令或选择来自蓝牙接收模块的数字音频信号的指令;主控集成电路根据系统主控微控制单元的指令选择来自音频编码电路的数字音频信号或来自蓝牙接收模块的数字音频信号进行语音识别处理。
2.根据权利要求1所述的语音识别系统,其特征在于:该系统具有一个蓝牙接收模块和一个以上的蓝牙发射模块。
3.一种语音识别的方法,其特征在于,该方法包括:
通过麦克风阵列接收近距离的语音信号并转换成模拟音频信号,然后将该模拟音频信号转换成数字音频信号,得到第一路数字音频信号;
通过蓝牙音频链路接收远距离的语音信号并转换成数字音频信号,得到第二路数字音频信号;
选择第一路数字音频信号或第二路数字音频信号进行语音识别处理;
所述选择对第一路数字音频信号或二路数字音频信号进行语音识别处理包括:根据用户的按键操作选择第一路数字音频信号或第二路数字音频信号,并对所选择的数字音频信号进行语音识别处理。
4.根据权利要求3所述的语音识别方法,其特征在于,所述蓝牙音频链路包括:蓝牙发射模块和蓝牙接收模块;
所述通过蓝牙音频链路接收语音信号并转换成数字音频信号包括:通过蓝牙发射模块接收语音信号并转换成数字音频信号后发送给蓝牙接收模块,蓝牙接收模块将所接收的数字音频信号作为所述第二路数字音频信号输出。
5.根据权利要求3所述的方法,其特征在于,所述蓝牙音频链路包括:一个以上的蓝牙发射模块和一个蓝牙接收模块。
一种语音识别系统和方法\n技术领域\n[0001] 本发明涉及语音识别技术领域,特别涉及一种语音识别系统和方法。\n背景技术\n[0002] 目前多种智能音视频设备都添加了语音识别功能。图1是现有的一种音视频设备的组成结构的示意图。如图1所示,该音视频设备包括:麦克风阵列101、音频编码电路102、摄像头103、视频处理电路104、主控集成电路105、系统主控微控制单元(系统主控MCU)\n106、扬声器107及显示屏108。\n[0003] 其中,麦克风阵列101负责语音信号的拾取并转换成模拟音频信号后输出给音频编码电路102,音频编码电路102将从麦克风阵列101接收的模拟音频信号进行数字编码,然后输出给主控集成电路105;摄像头103用于捕获视频信号并输出给视频处理电路104,视频处理电路104用于对摄像头103输出的信号进行编码处理后输出给主控集成电路105;\n主控集成电路105汇集视频信号和音频信号后,合成音视频数据流输出给系统主控微控制单元106。系统主控微控制单元106为该音视频设备的核心器件,负责音视频数据链路的管理。从系统主控微控制单元106输出的音频信号通过音频扬声器107变成声音信号,从系统主控微控制单元106.输出的视频信号通过显示屏108进行显示。此外,图1所示的音视频设备还包括作为外围接口的USB接口和负责整个系统的稳定供电的电源电路等,这里不再一一赘述。\n[0004] 在现有的如图1所示的具有语音识别功能的音视频设备中,不论采用全指向麦克风阵列还是采用单指向麦克风音阵列,都有一定的识别距离,所以只能进行近距离语音识别,而对远距离语音无能为力。\n发明内容\n[0005] 本发明提供了一种语音识别系统和方法,以解决只有麦克风阵列作为音频输入的语音识别系统无法对远距离语音进行识别的问题。\n[0006] 为达到上述目的,本发明的技术方案是这样实现的:\n[0007] 本发明公开了一种语音识别系统,包括:麦克风阵列、音频编码电路、主控集成电路、蓝牙接收模块和蓝牙发射模块,其中:\n[0008] 麦克风阵列,用于接收语音信号并转换成模拟音频信号后输出给音频编码电路;\n[0009] 音频编码电路,用于将所接收的模拟音频信号转换成数字音频信号后输出给主控集成电路;\n[0010] 蓝牙发射模块,用于接收语音信号并转换成数字音频信号后通过蓝牙方式发送给蓝牙接收模块;\n[0011] 蓝牙接收模块,用于将所接收的数字音频信号发送给主控集成电路;\n[0012] 主控集成电路,用于选择接收来自音频编码电路的数字音频信号或来自蓝牙接收模块的数字音频信号进行语音识别处理。\n[0013] 在上述语音识别系统中,具有一个蓝牙接收模块和一个以上的蓝牙发射模块。\n[0014] 在上述语音识别系统中,所述主控集成电路具有按键,所述主控集成电路根据用户对该按键的操作选择来自音频编码电路的数字音频信号或来自蓝牙接收模块的数字音频信号进行语音识别处理。\n[0015] 上述语音识别系统还包括:系统主控微控制单元,用于接收来自主控集成电路的音频数据流;\n[0016] 该系统主控微控制单元具有按键,该系统主控微控制单元根据用户对该按键的操作向主控集成电路发送选择来自音频编码电路的数字音频信号的指令或选择来自蓝牙接收模块的数字音频信号的指令;\n[0017] 主控集成电路根据系统主控微控制单元的指令选择来自音频编码电路的数字音频信号或来自蓝牙接收模块的数字音频信号进行语音识别处理。\n[0018] 本发明还公开了一种语音识别的方法,该方法包括:\n[0019] 通过麦克风阵列接收语音信号并转换成模拟音频信号,然后将该模拟音频信号转换成数字音频信号,得到第一路数字音频信号;\n[0020] 通过蓝牙音频链路接收语音信号并转换成数字音频信号,得到第二路数字音频信号;\n[0021] 选择第一路数字音频信号或第二路数字音频信号进行语音识别处理。\n[0022] 在上述方法中,所述蓝牙音频链路包括:蓝牙发射模块和蓝牙接收模块;\n[0023] 所述通过蓝牙音频链路接收语音信号并转换成数字音频信号包括:通过蓝牙发射模块接收语音信号并转换成数字音频信号后发送给蓝牙接收模块,蓝牙接收模块将所接收的数字音频信号作为所述第二路数字音频信号输出。\n[0024] 所述蓝牙音频链路包括:一个以上的蓝牙发射模块和一个蓝牙接收模块。\n[0025] 在上述方法中,所述选择第一路数字音频信号或第二路数字音频信号进行语音识别处理包括:\n[0026] 根据用户的按键操作选择第一路数字音频信号或第二路数字音频信号,对并所选择的数字音频信号进行语音识别处理。\n[0027] 由上述可见,在本发明的方案中,由于语音识别系统包括麦克风阵列链路和蓝牙链路两路语音输入链路,在进行语音识别时在两路链路中进行选择,其中的蓝牙链路可以实现远距离语音的接收,因此可以对远距离的语音进行识别。\n附图说明\n[0028] 图1是现有的一种音视频设备的组成结构的示意图;\n[0029] 图2为本发明实施例中的包含语音识别系统的音视频设备的组成结构的示意图。\n具体实施方式\n[0030] 本发明中,通过麦克风阵列接收语音信号并转换成模拟音频信号,然后将该模拟音频信号转换成数字音频信号,得到第一路数字音频信号;并且通过蓝牙音频链路接收语音信号并转换成数字音频信号,得到第二路数字音频信号;然后选择第一路数字音频信号或第二路数字音频信号进行语音识别处理。这样,对于较近的一些语音可以通过麦克风阵列进行拾取,而对于较远局域的语音,则可以通过的蓝牙链路实现接收,因此解决了只有麦克风阵列作为音频输入的语音识别系统无法对远距离语音进行识别的问题。\n[0031] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。\n[0032] 图2为本发明实施例中的包含语音识别系统的音视频设备的组成结构的示意图。\n如图2所示,该系统包括:麦克风阵列101、音频编码电路102、摄像头103、视频处理电路\n104、主控集成电路205、系统主控微控制单元206、扬声器107、显示屏108、蓝牙接收模块\n201和蓝牙发射模块202。这里蓝牙发射模块202的个数为一个或多个,图2中示意出了多个蓝牙发射模块202。另外由于本发明的实施例中对主控集成电路和系统主控微控制单元的功能都进行了改进,因此采用了与图1中不同的附图标记。\n[0033] 其中,麦克风阵列101,用于接收语音信号并转换成模拟音频信号后输出给音频编码电路102。音频编码电路102,用于将所接收的模拟音频信号转换成数字音频信号后输出给主控集成电路205。摄像头103用于捕获视频信号并输出给视频处理电路104,视频处理电路104用于对摄像头103输出的信号进行编码处理后输出给主控集成电路205;\n[0034] 蓝牙发射模块202,用于接收语音信号并转换成数字音频信号后通过蓝牙方式发送给蓝牙接收模块201;蓝牙接收模块201,用于将所接收的数字音频信号发送给主控集成电路205;\n[0035] 主控集成电路205,用于选择来自音频编码电路102的数字音频信号或来自蓝牙接收模块201的数字音频信号进行语音识别处理。即主控集成电路205先在来自音频编码电路102的数字音频信号和来自蓝牙接收模块102的数字音频信号之间进行选择,然后将选择的数字音频信号与来自视频处理电路104的数字视频信号汇集,合成音视频数据流后输出给系统主控微控制单元206。系统主控微控制单元206负责音视频数据链路的管理。\n从系统主控微控制单元206输出的音频信号通过音频扬声器107变成声音信号,从系统主控微控制单元206输出的视频信号通过显示屏108进行显示。\n[0036] 可见,在图2所示的实施例中有两条音频输入链路,分别为麦克风阵列音频链路和蓝牙音频链路。其中,麦克风阵列音频链路包括:麦克风阵列101和音频编码电路102,麦克风阵列101接收语音信号并转换成模拟音频信号后输出给音频编码电路102,音频编码电路102将所接收的模拟音频信号转换成数字音频信号后作为第一路数字音频信号输出给主控集成电路205。蓝牙音频链路包括:蓝牙发射模块202和蓝牙接收模块201;通过蓝牙发射模块202接收语音信号并转换成数字音频信号后发送给蓝牙接收模块201,蓝牙接收模块201将所接收的数字音频信号作为第二路数字音频信号输出给主控集成电路205。\n主控集成电路205在第一路数字音频信号和第二路数字音频信号之间进行选择。\n[0037] 在本法明的上述实施中,保留了麦克风阵列,以实现近距离的语音识别。在此基础上增加了蓝牙语音输入方式,以实现远程语音识别。蓝牙传输技术支持一对多的通信,即可以设置一个蓝牙接收模块和多个的蓝牙发射模块。实践中可以根据需要配备多个蓝牙发射模块,以实现多点语音识别。由于用蓝牙方式可以远距离传输信号,故本系统可以进行远程语音识别。\n[0038] 在本发明的实施例中,可以通过按键控制主控集成电路205的对数字音频信号的选择。\n[0039] 例如,可以在主控集成电路205上设置一个按键式的控制端,主控集成电路205根据用户对该按键的操作选择来自音频编码电路102的数字音频信号或来自蓝牙接收模块\n201的数字音频信号进行语音识别处理。\n[0040] 或者,也可以在系统主控微控制单元206上设置按键式的控制端,系统主控微控制单元206根据用户对该按键的操作向主控集成电路205发送选择来自音频编码电路102的数字音频信号的指令或选择来自蓝牙接收模块201的数字音频信号的指令;主控集成电路205根据系统主控微控制单元206的指令选择来自音频编码电路102的数字音频信号或来自蓝牙接收模块201的数字音频信号进行语音识别处理。本发明实施例中对系统主控微控制单元的改进也正是在于此。\n[0041] 综上所述,在本发明的方案中,由于语音识别系统包括麦克风阵列链路和蓝牙链路两路语音输入链路,在进行语音识别时在两路链路中进行选择,其中的蓝牙链路可以实现远距离语音的接收以及实现多点语音控制,因此可以对多个远距离的语音进行识别,使用户更好的体会语音识别的优越性。\n[0042] 以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
法律信息
- 2016-09-07
专利权人的姓名或者名称、地址的变更
专利权人由歌尔声学股份有限公司变更为歌尔股份有限公司
地址由261031 山东省潍坊市高新技术产业开发区东方路268号变更为261031 山东省潍坊市高新技术产业开发区东方路268号
- 2014-08-13
- 2013-01-30
实质审查的生效
IPC(主分类): G10L 15/26
专利申请号: 201210290828.6
申请日: 2012.08.15
- 2012-12-12
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2010-03-31
|
2008-05-27
| | |
2
| | 暂无 |
2012-08-15
| | |
3
| | 暂无 |
2007-11-23
| | |
4
| | 暂无 |
2010-06-25
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |