1.一种语音识别方法,其特征在于,包括以下步骤:
A、系统进行检测是否需要对语音信号进行识别,如果需要,则转向步骤B,否则,继续检测;
B、获取语音音频信号,对音频信号进行去噪和放大;
C、对音频信号进行识别,并对识别结果进行读取和进行命令词类别判断,如果是显示类命令词,转向步骤D,否则转向步骤E;
D、进行结果显示和语音播报并结束本次控制识别结束;
E、则进行命令词级别判断,如果是父控制命令,转向步骤F,如果是叶控制命令则转向步骤G;
F、进行语音播报提示和语音录入,转入步骤B;
G、执行叶控制指令,转入步骤D;
在所述的步骤C中,对音频信号进行识别包括以下步骤:
C01、语音识别控制系统进入伺服状态,接收语音输入,
C02、根据应用场景将语音送交不同的识别引擎进行识别,如果是需要云识别引擎识别则转向步骤C04,如果是需要本地引擎识别则转向步骤C03;
C03、语音送交本地引擎,识别引擎将根据具体的应用场景加载不同的命令词子集,获取识别输出结果;
C04、将通过通信网络送交云识别引擎识别,取得结果后,通过通信网络返回;
在所述的C02中,按照下面的方式判断将语音信号送交本地引擎还是云引擎: 第一次识别开始使用本地引擎→根据识别出来的场景设置下一次将命令词送交目标本地或云引擎→第二次录音识别开始→…
从使用云引擎的特殊应用场景切换到使用本地引擎,使用了以下两种方式,一种是硬按键,就是方向盘上的那个触发识别系统的按钮,将打断本次云识别应用场景,返回到使用本地引擎的场景;
第二种方案是在进入使用云引擎的场景,不仅将录入信息送交云引擎也会提交给本地引擎,本地引擎只对退出命令词敏感,当本地引擎检测到退出命令词的时候,将退出当前命令词场景,返回到使用本地引擎的场景。
2.根据权利要求1所述的语音识别方法,其特征在于:所述的叶控制命令是指该指令执行完以后,本次控制识别就会结束类指令;所述的父控制指令是指该指令执行完后还有本类指令的叶控制指令需要识别的指令。
3.一种根据权利要求1所述的语音识别方法的车载多媒体导航仪系统,其特征在于:
包括语言接收装置、低噪放大电路、语音识别引擎、存储器、微处理器,所述的语言接收装置包括触发是否接收语音信号的触发装置,触发装置是一个硬件开关,设置在方向盘上;所述的语言接收装置、低噪放大电路、语音识别引擎依次连接,所述的语音识别引擎的控制信号端与所述的微处理器相连,所述的存储器中存储有控制命令词,所述的存储器与所述的微处理器相连。
4.根据权利要求3所述的车载多媒体导航仪系统,其特征在于:在所述的低噪放大电路和语音识别引擎之间还包括模数转换电路,所述的模数转换电路的模拟信号输入端接所述的低噪放大电路的输出端,所述的模数转换电路的数字信号输出端接所述的语音识别引擎。
5.根据权利要求4所述的车载多媒体导航仪系统,其特征在于:所述的语音识别引擎包括本地识别引擎和云识别引擎,所述的本地识别引擎与所述的模数转换电路的数字信号输出端直接连接,所述的云识别引擎通过互联网与所述的模数转换电路的数字信号输出端连接。
一种语音识别方法及具有语音识别的车载多媒体导航仪系\n统\n技术领域\n[0001] 本发明涉及车载导航仪领域,特别涉及多媒体车载仪中支持语音识别的方法和具有语音识别的多媒体车载导航仪。\n背景技术\n[0002] 随着汽车产业的发展使汽车越来越成为生活的一部分,人们的上下班、节假日旅游和寻亲访友过程中都需要在汽车上度过大部分时间,然而在行车过程中驾驶员操控多媒体设备听歌、听广播或进行目的地导航设置等操作都会给行车安全带来隐患,而汽车内非驾驶人员进行操作又存在操作位置不方便的问题。因此智能语音识别在车载多媒体导航系统中的应用显得越来越紧迫。在传统车载导航时代,由于车载环境声源复杂,导航系统芯片处理能力有限性和语音识别技术发展的不成熟导致在车载环境中进行语音识别的效果很不理想,基本达不到应用产品的水平。而如今随着各种嵌入式平台日益发展成熟、处理芯片功能的日趋强大和车载行业中移动互联网行业的快速发展,车载多媒体导航系统中智能语音识别技术已经取得了长足的进步,在汽车里通过说话自动控制整个多媒体导航系统已经从理想变成现实。\n发明内容\n[0003] 本发明的目的就是克服在在传统车载导航时代,由于车载环境声源复杂,导航系统芯片处理能力有限性和语音识别技术发展的不成熟导致在车载环境中进行语音识别的效果很不理想,基本达不到应用产品的水平的不足,提供一种语音识别方法及具有语音识别的车载多媒体导航仪系统。\n[0004] 首先本发明提供一种语音识别方法,包括以下步骤:\n[0005] A、系统进行检测是否需要对语音信号进行识别,如果需要,则转向步骤B,否则,继续检测;\n[0006] B、获取语音音频信号,对音频信号进行去噪和放大;\n[0007] C、对音频信号进行识别,并对识别结果进行读取和进行命令词类别判断,如果是显示类命令词,转向步骤D,否则转向步骤E;\n[0008] D、进行结果显示和语音播报并结束本次控制识别结束;\n[0009] E、则进行命令词级别判断,如果是父控制命令,转向步骤F,如果是叶控制命令则转向步骤G;\n[0010] F、进行语音播报提示和语音录入,转入步骤B;\n[0011] G、执行叶控制指令,转入步骤D。\n[0012] 进一步的,上述的语音识别方法中:在所述的步骤C中,对音频信号进行识别包括以下步骤:\n[0013] C01、语音识别控制系统进入伺服状态,接收语音输入,\n[0014] C02、根据应用场景将语音送交不同的识别引擎进行识别,如果是需要云识别引擎识别则转向步骤C04,如果是需要本地引擎识别则转向步骤C03;\n[0015] C03、语音送交本地引擎,识别引擎将根据具体的应用场景加载不同的命令词子集,获取识别输出结果;\n[0016] C04、将通过通信网络送交云识别引擎识别,取得结果后,通过通信网络返回。\n[0017] 进一步的,上述的语音识别方法中:所述的叶控制命令是指该指令执行完以后,本次控制识别就会结束类指令;所述的父控制指令是指该指令执行完后还有本类指令的叶控制指令需要识别的指令。\n[0018] 本发明还提供一种根据权利要求上述的语音识别方法的车载多媒体导航仪系统,包括语言接收装置、低噪放大电路、语音识别引擎、存储器、微处理器,所述的语言接收装置包括触发是否接收语音信号的触发装置,所述的语言接收装置、低噪放大电路、语音识别引擎依次连接,所述的语音识别引擎的控制信号端与所述的微处理器相连,所述的存储器中存储有控制命令词,所述的存储器与所述的微处理器相连。\n[0019] 进一步的,上述的车载多媒体导航仪系统中:在所述的低噪放大电路和语音识别引擎之间还包括模数转换电路,所述的模数转换电路的模拟信号输入端接所述的低噪放大器的输出端,所述的模数转换电路的数字信号输出端接所述的语音识别引擎[0020] 进一步的,上述的车载多媒体导航仪系统中:所述的语音识别引擎包括本地识别引擎和云识别引擎,所述的本地识别引擎与所述的模数转换电路的数字信号输出端直接连接,所述的云识别引擎通过互联网与所述的模数转换电路的数字信号输出端连接。\n[0021] 本发明的语音识别系统随车载系统启动而启动,启动时语音控制识别系统将扫描加载该车载系统中音乐、收音机、蓝牙电话、导航和其他带互联网功能应用软件的控制命令词,加载成功后开启语音控制识别系统的伺服功能,在用户触发识别系统后,语音提示用户输入语音命令,将车载系统采集的经过硬件电路处理后语音数据送交识别模块,获取识别结果,然后根据上下文转入不同的命令词处理,从而实现语音控制车载多媒体导航系统。\n[0022] 下面通过结合具体实施例和附图对本发明进行进一步的说明。\n附图说明\n[0023] 附图1是本发明车载多媒体导航仪系统构架图。\n[0024] 附图2是本发明流程图。\n[0025] 附图3是本发明实施例中采用的上下文分类处理算法能描述流程图。\n具体实施方式\n[0026] 本实施例是一种具有语音识别功能的车载多媒体导航系统,该系统可以通过语音对多媒体车载导航系统进行操作,使用方便。\n[0027] 如图1所示,为本实施例的车载多媒体导航仪系统构架图,该车载多媒体导航仪系统包括语言接收装置、低噪放大电路、模数转换电路、语音识别引擎、存储器、微处理器。\n其中,语言接收装置包括触发是否接收语音信号的触发装置该触发装置一般是一个硬件开关,为了方便操作将该硬件开关设置在方向盘上。语言接收装置、低噪放大电路、模数转换电路、语音识别引擎依次连接,当触发开关打开以后,语言接收装置接收语音信号通过低噪放大电路放大后进入到模数转换电路转换成数字信号,然后在微处理器的控制下由语音识别引擎进行识别,在识别过程中还可以参照存储在存储器中的控制命令词。本实施例中,语音识别引擎包括本地识别引擎和云识别引擎,本地识别引擎与所述的模数转换电路的数字信号输出端直接连接,云识别引擎通过互联网与所述的模数转换电路的数字信号输出端连接。\n[0028] 本实施例所采用的语音识别方法,包括以下步骤:\n[0029] A、系统进行检测是否需要对语音信号进行识别,如果需要,则转向步骤B,否则,继续检测;\n[0030] B、获取语音音频信号,对音频信号进行去噪和放大;\n[0031] C、对音频信号进行识别,并对识别结果进行读取和进行命令词类别判断,如果是显示类命令词,转向步骤D,否则转向步骤E;\n[0032] C01、语音识别控制系统进入伺服状态,接收语音输入,\n[0033] C02、根据应用场景将语音送交不同的识别引擎进行识别;\n[0034] C03、获取识别输出结果。\n[0035] D、进行结果显示和语音播报并结束本次控制识别结束;\n[0036] E、则进行命令词级别判断,如果是父控制命令,转向步骤F,如果是叶控制命令则转向步骤G;\n[0037] F、进行语音播报提示和语音录入,转入步骤B;\n[0038] G、执行叶控制指令,转入步骤D。\n[0039] 在步骤C02中:发信息的时候,将通过网络送交云识别引擎,再取得结果,而控制打开本地音乐或电台则将语音送交本地识别引擎。这里如何判断将语音信号送交本地引擎还是云引擎,这里主要根据是根据一个上下文感念,也就是情景,举个例子,如果说“打开音乐”这个命令,说这个命令的时候肯定是送交本地引擎的,因为识别系统刚刚启动,也就是没有进入任何上下文(应用场景)时,它的语音信号是送交本地引擎的,“打开音乐”打开音乐这个应用以后,我们就进入了音乐这个场景,这个时候我们根据需要设置下一次录音信息是送交本地还是云引擎。说的简单一点就是:第一次识别开始(本地引擎)→根据识别出来的场景设置下一次将命令词送交目标(本地或云引擎)→第二次录音识别开始→…[0040] 从使用云引擎的特殊应用场景如何切换到使用本地引擎,使用了两种方案,一种是硬按键,就是方向盘上的那个触发识别系统的按钮,我们将打断本次云识别应用场景,返回到使用本地引擎的场景;还有一种方案,在进入使用云引擎的场景,不仅将录入信息送交云引擎也会提交给本地引擎,不过本地引擎只对例如“退出”这样的命令词敏感,当本地引擎检测到退出命令词的时候,将退出当前命令词场景,返回到使用本地引擎的场景。\n[0041] 本实施例中,语音识别控制系统启动时,将扫描读取所有需要控制应用软件命令词表,软件命令词表是本实施例中重要的软件,一般是保存在本地存储器中,软件命令词表一般包括了尽可能多的命令词。考虑到识别的效率和有效性,识别系统采取多级命令词加载形式,如图2所示上下文场景切换命令词加载算法描述流程图,用户在触发开始后,语音识别控制系统进入伺服状态,接收语音输入,此时本地引擎只加载了最基本的控制命令词,就是所谓的一级命令词。当用户语音输入并获取识别结果,系统根据命令词结果进入不同的应用场景,如果是父控制指令,例如:识别出打开收音机后,进入收音机,控制系统将电台频率和收音机相关控制命令词加载到本地识别引擎中(此所谓二级命令词),在本次识别过程中(包括成功识别到用户的语音指令和未成功识别获取语音指令次数超过阈值),用户输入的数字电台名称在文字和数字混合识别时识别率低的问题得到了较好的解决,其他的场景类似;如果是叶控制指令直接执行指令对应操作,退出本次识别。而如果识别出的父控制命令词是例如发短消息的时候,应用场景将切换到将录入语音送交云识别引擎。\n[0042] 如图3所示,为实施例中采用的上下文分类处理算法能描述流程图,图中,识别引擎返回识别结果,如果识别出的命令词是显示类命令词(例如发短信时的从云端返回识别出的短信内容),识别控制系统将显示并播报识别内容,如果识别命令词是控制类,则分为父控制指令和叶控制指令(父控制指令是指该指令执行完成后还有与本来控制指令相关的叶控制指令需要识别,而叶控制指令是指该指令执行完后本次控制识别就会结束类指令),父控制指令(例如:查询天气命令,识别出改命令后控制识别系统将提示用户需要查询哪个城市的天气,此时的查询天气即为父控制指令)将提示用户继续进行相应的语音控制录入,系统将录入的语音命令送交识别引擎,从而开始另外一次控制识别,而叶控制指令(上面查询天气的例子中,提示用户语音输入具体的城市名称,此时的城市名称则为叶控制指令)执行完相应操作后也将转入结果显示和语音播报模块。
法律信息
- 2016-02-03
- 2013-10-16
实质审查的生效
IPC(主分类): G10L 15/00
专利申请号: 201210285980.5
申请日: 2012.08.13
- 2013-09-11
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2012-06-13
|
2011-11-30
| | |
2
| |
2012-04-04
|
2011-10-27
| | |
3
| | 暂无 |
2009-09-11
| | |
4
| |
2011-01-26
|
2009-07-15
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |