著录项信息
专利名称 | 基于网络的语音提醒的系统 |
申请号 | CN201020698052.8 | 申请日期 | 2010-12-31 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | | 公开/公告号 | |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04L29/08 | IPC分类号 | H;0;4;L;2;9;/;0;8;;;G;1;0;L;1;5;/;0;0查看分类表>
|
申请人 | 上海博泰悦臻电子设备制造有限公司 | 申请人地址 | 上海市中山西路1800号兆丰环球大厦2楼D1座
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 上海博泰悦臻电子设备制造有限公司,上海汽车集团股份有限公司 | 当前权利人 | 上海博泰悦臻电子设备制造有限公司,上海汽车集团股份有限公司 |
发明人 | 张晔晖 |
代理机构 | 上海专利商标事务所有限公司 | 代理人 | 施浩 |
摘要
本实用新型公开了基于网络的语音提醒的系统,方便了用户输入提醒的方式,在不增加终端负担的情况下提升了语音识别的识别率,还增强了提醒用户的直观感受。其技术方案为:系统包括终端系统和云端系统,终端系统包括语音输入装置、终端数据传输模块、存储模块、提醒模块,云端系统包括云端数据传输模块、语音引擎。
1.一种基于网络的语音提醒的系统,包括终端系统和云端系统,终端系统包括语音输入装置、终端数据传输模块、存储模块、提醒模块,云端系统包括云端数据传输模块、语音引擎:
语音输入装置,接收用户输入的语音资料;
终端数据传输模块,将用户输入的语音资料上传到云端系统,并接收云端系统传来的识别出的内容信息;
存储模块,存储识别出的内容信息;
提醒模块,根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息;
云端数据传输模块,接收终端上传的用户输入的语音资料,并将语音引擎识别出的内容信息传输给终端系统;
语音引擎,根据语音输入识别其中的内容信息。
2.根据权利要求1所述的基于网络的语音提醒的系统,其特征在于,该终端系统还包括:
数据传输接口,耦接存储模块,将存储模块中的资料传输到外部设备。
3.根据权利要求1所述的基于网络的语音提醒的系统,其特征在于,该终端系统还包括:
降噪模块,耦接语音输入装置和终端数据传输模块,对语音输入进行降噪处理。
4.根据权利要求1-3中任一项所述的基于网络的语音提醒的系统,其特征在于,该终端系统是车载终端系统。
基于网络的语音提醒的系统\n技术领域\n[0001] 本实用新型涉及一种语音提醒技术,尤其涉及一种在网络的云端服务器进行语音识别并在终端进行语音提醒的系统。\n背景技术\n[0002] 在一些电子设备上通常有备忘录的功能(或称为提醒功能),用户输入需要提醒的信息并设置提醒的时间点。在设置的时间点到达时,电子设备会通过某种提醒方式(例如闹铃)来提醒用户有提醒事件发生,具体的内容会在电子设备的屏幕上显示出来。\n[0003] 这种提醒方式存在以下的不便之处:\n[0004] 1、这种方式需要用户在电子设备的软件中文字输入提醒内容和选择提醒的时间点,输入方式繁琐。如果应用环境是在车辆的行驶过程中,则车主进行提醒设置会带来行车安全上的问题。\n[0005] 2、这种方式的提醒方式不够直接,当提醒闹铃开启时,用户无法直接获知提醒的内容,而需要按下相应的按键,进入到当前提醒条目中来查看提醒的内容。同样的,如果应用环境是在车辆的行驶过程中,则车主进入提醒软件查看提醒内容也会带来行车安全上的问题。\n[0006] 此外,大多数电子设备的语音识别的引擎通常都设计在设备内部,如果需要识别率较高的语音技术,则需要电子设备耗费大量的资源。通常终端处理器的处理能力有限,无法满足需要耗费大量资源的语音识别。\n实用新型内容\n[0007] 本实用新型的目的在于解决上述问题,提供了一种基于网络的语音提醒的系统,方便了用户输入提醒的方式,在不增加终端负担的情况下提升了语音识别的识别率,还增强了提醒用户的直观感受。\n[0008] 本实用新型的技术方案为:\n[0009] 本实用新型揭示了一种基于网络的语音提醒的系统,包括终端系统和云端系统,终端系统包括语音输入装置、终端数据传输模块、存储模块、提醒模块,云端系统包括云端数据传输模块、语音引擎:\n[0010] 语音输入装置,接收用户输入的语音资料;\n[0011] 终端数据传输模块,将用户输入的语音资料上传到云端系统,并接收云端系统传来的识别出的内容信息;\n[0012] 存储模块,存储识别出的内容信息;\n[0013] 提醒模块,根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息;\n[0014] 云端数据传输模块,接收终端上传的用户输入的语音资料,并将语音引擎识别出的内容信息传输给终端系统;\n[0015] 语音引擎,根据语音输入识别其中的内容信息。\n[0016] 根据本实用新型的基于网络的语音提醒的系统的一实施例,该终端系统还包括:\n[0017] 数据传输接口,耦接存储模块,将存储模块中的资料传输到外部设备。\n[0018] 根据本实用新型的基于网络的语音提醒的系统的一实施例,该终端系统还包括:\n[0019] 降噪模块,耦接语音输入装置和终端数据传输模块,对语音输入进行降噪处理。\n[0020] 根据本实用新型的基于网络的语音提醒的系统的一实施例,该终端系统是车载终端系统。\n[0021] 本实用新型对比现有技术有如下的有益效果:本实用新型的技术方案是先由终端接收用户的语音输入,将语音输入传输到云端,云端对语音输入进行语音识别,并将识别出的内容信息传输回终端,在终端对识别出的内容信息进行存储。终端根据识别出的内容信息,借助音频播放设备进行提醒,提醒的内容就是识别出的内容信息。对比现有技术,本实用新型一方面用语音输入替代了传统的文字输入,一方面用语音提醒替代了传统的需要用户浏览的提醒方式,一方面减轻了终端的处理负担,将语音识别的任务交给云端去处理。\n附图说明\n[0022] 图1示例性的示出了本实用新型的基于网络的语音提醒的系统的第一实施例的流程图。\n[0023] 图2示例性的示出了本实用新型的基于网络的语音提醒的系统的第二实施例的流程图。\n[0024] 图3示例性的示出了本实用新型的基于网络的语音提醒的系统的第三实施例的流程图。\n具体实施方式\n[0025] 下面结合附图和实施例对本实用新型作进一步的描述。\n[0026] 基于网络的语音提醒的系统的第一实施例\n[0027] 图1示出了本实用新型的基于网络的语音提醒的系统的第一实施例的原理。请参见图1,本实施例的基于网络的语音提醒的系统包括终端系统10和云端系统12。终端系统\n10包括语音输入装置100、终端数据传输模块102、存储模块104以及提醒模块106。云端系统12包括云端数据传输模块120和语音引擎122。\n[0028] 终端系统10内部各个模块的连接关系是:语音输入装置100耦接终端数据传输模块102、终端数据传输模块102耦接存储模块104、存储模块104耦接提醒模块106。\n[0029] 云端系统12内部各个模块的连接关系是:云端数据传输模块120耦接语音引擎\n122。\n[0030] 系统的运行过程如下。\n[0031] 终端系统10的语音输入装置100接收用户的语音输入。\n[0032] 在车载端,用户通过车载端上的音频输入接口输入语音,例如,用户说出“今日下午3点提醒有会议”,车载端接收用户的这一输入语音。\n[0033] 终端系统10的终端数据传输模块102负责将语音输入的数据传输给云端。即,通过网络(互联网、3G网络等)将从用户处接收到的语音输入数据传输给云端。\n[0034] 云端系统12的云端数据传输模块120负责接收来自终端的语音输入数据,并由语音引擎122根据语音输入的数据识别其中的内容信息。\n[0035] 语音引擎122的语音识别技术是现有的技术。例如,语音引擎122包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块九个部分,该声学层识别模块采用以状态的段长概率来表示的隐含马尔可夫模型,即基于段长分布的隐含马尔可夫模型,简称DDBHMM模型,该模型的段长服从具有凸性的分布,其中,该模型中的状态与语音中的音素或音节等语音单元相对应,而这些语音单元读音的语音信号特征作为对应语音单元的观测量;该训练模块的训练方法步骤如下:对训练模块输入一个或多个包含有若干特定词的读音样本文件,该文件中的每句话的一系列帧的特征向量以帧为单位,通过训练模块中的训练搜索算法,对每帧语音信号中的每个词的每个状态进行搜索比较,得到语音信号特征矢量的矢量量化码本(VQ码本)和该特定词的DDBHMM模型参数,输入给声学层识别模块;所述的汉语连续语音识别系统的语音识别方法步骤如下:通过语音采集装置接收人们的语音信号,对于输入的语音信号进行前端处理,并进行MFCC语音特征(基于Mel倒谱系数的语音特征,Mel-Frequency Cepstral Coefficients)序列的提取,得到的该MFCC语音特征序列被送入声学层识别模块,通过声学层识别模块的搜索算法,产生拼音格形式的识别结果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,精简后的音节格被送入语言理解模块,转化为拼音图和词图,并在词图中进行搜索,得到最后的理解结果。\n[0036] 例如,语音引擎能够识别出“今日下午3点提醒有会议”的具体内容,获知这是一个提醒事件,提醒的内容是“今日下午3点有会议”。\n[0037] 云端数据传输模块120负责将识别出的内容信息传输到终端系统10。\n[0038] 终端系统10的存储模块104存储传输来的内容信息。\n[0039] 提醒模块106根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。\n[0040] 云端系统12识别出了这是一个提醒事件,且是提醒在今日下午3点有会议。因此,在今日下午3点的时刻,车载端触发一个提醒事件,并且通过语音提醒的方式来告知用户,即通过车载端上的音频播放设备(例如扬声器)播放“今日下午3点有会议”的内容。\n[0041] 从上述实施例中可以看出,接收语音输入、通过语音方式提醒用户都是在终端完成的(在本实施例中是车载终端),而语音识别是在云端完成的。\n[0042] 基于网络的语音提醒的系统的第二实施例\n[0043] 图2示出了本实用新型的基于网络的语音提醒的系统的第二实施例的原理。请参见图2,本实施例的基于网络的语音提醒的系统包括终端系统20和云端系统22。终端系统\n20包括语音输入装置200、终端数据传输模块202、存储模块204、提醒模块206和数据传输接口208。云端系统22包括云端数据传输模块220和语音引擎222。\n[0044] 终端系统20内部各个模块的连接关系是:语音输入装置200耦接终端数据传输模块202、终端数据传输模块202耦接存储模块204、存储模块204耦接提醒模块206、存储模块204耦接数据传输接口208。\n[0045] 云端系统22内部各个模块的连接关系是:云端数据传输模块220耦接语音引擎\n222。\n[0046] 系统的运行过程如下。\n[0047] 终端系统20的语音输入装置200接收用户的语音输入。\n[0048] 在车载端,用户通过车载端上的音频输入接口输入语音,例如,用户说出“今日下午3点提醒有会议”,车载端接收用户的这一输入语音。\n[0049] 终端系统20的终端数据传输模块202负责将语音输入的数据传输给云端。即,通过网络(互联网、3G网络等)将从用户处接收到的语音输入数据传输给云端。\n[0050] 云端系统22的云端数据传输模块220负责接收来自终端的语音输入数据,并由语音引擎222根据语音输入的数据识别其中的内容信息。\n[0051] 语音引擎222的语音识别技术是现有的技术。例如,语音引擎222包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块九个部分,该声学层识别模块采用以状态的段长概率来表示的隐含马尔可夫模型,即基于段长分布的隐含马尔可夫模型,简称DDBHMM模型,该模型的段长服从具有凸性的分布,其中,该模型中的状态与语音中的音素或音节等语音单元相对应,而这些语音单元读音的语音信号特征作为对应语音单元的观测量;该训练模块的训练方法步骤如下:对训练模块输入一个或多个包含有若干特定词的读音样本文件,该文件中的每句话的一系列帧的特征向量以帧为单位,通过训练模块中的训练搜索算法,对每帧语音信号中的每个词的每个状态进行搜索比较,得到语音信号特征矢量的矢量量化码本(VQ码本)和该特定词的DDBHMM模型参数,输入给声学层识别模块;所述的汉语连续语音识别系统的语音识别方法步骤如下:通过语音采集装置接收人们的语音信号,对于输入的语音信号进行前端处理,并进行MFCC语音特征(基于Mel倒谱系数的语音特征,Mel-Frequency Cepstral Coefficients)序列的提取,得到的该MFCC语音特征序列被送入声学层识别模块,通过声学层识别模块的搜索算法,产生拼音格形式的识别结果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,精简后的音节格被送入语言理解模块,转化为拼音图和词图,并在词图中进行搜索,得到最后的理解结果。\n[0052] 例如,语音引擎能够识别出“今日下午3点提醒有会议”的具体内容,获知这是一个提醒事件,提醒的内容是“今日下午3点有会议”。\n[0053] 云端数据传输模块220负责将识别出的内容信息传输到终端系统20。\n[0054] 终端系统20的存储模块204存储传输来的内容信息。\n[0055] 提醒模块206根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。\n[0056] 云端系统22识别出了这是一个提醒事件,且是提醒在今日下午3点有会议。因此,在今日下午3点的时刻,车载端触发一个提醒事件,并且通过语音提醒的方式来告知用户,即通过车载端上的音频播放设备(例如扬声器)播放“今日下午3点有会议”的内容。\n[0057] 终端系统20的数据传输接口208将存储模块104中的数据导出到外部设备(例如电脑),由用户进行编辑处理。\n[0058] 从上述实施例中可以看出,接收语音输入、通过语音方式提醒用户都是在终端完成的(在本实施例中是车载终端),而语音识别是在云端完成的。\n[0059] 基于网络的语音提醒的系统的第三实施例\n[0060] 图3示出了本实用新型的基于网络的语音提醒的系统的第三实施例的原理。请参见图3,本实施例的基于网络的语音提醒的系统包括终端系统30和云端系统32。终端系统\n30包括语音输入装置300、终端数据传输模块302、存储模块304、提醒模块306和降噪模块\n308。云端系统32包括云端数据传输模块320和语音引擎322。\n[0061] 终端系统30内部各个模块的连接关系是:语音输入装置300耦接降噪模块308,降噪模块308耦接终端数据传输模块302、终端数据传输模块302耦接存储模块304、存储模块304耦接提醒模块206。\n[0062] 云端系统32内部各个模块的连接关系是:云端数据传输模块320耦接语音引擎\n322。\n[0063] 系统的运行过程如下。\n[0064] 终端系统30的语音输入装置300接收用户的语音输入。\n[0065] 在车载端,用户通过车载端上的音频输入接口输入语音,例如,用户说出“今日下午3点提醒有会议”,车载端接收用户的这一输入语音。\n[0066] 降噪模块308用于对输入的语音进行降噪处理。\n[0067] 终端系统30的终端数据传输模块302负责将语音输入且经过降噪处理的数据传输给云端。即,通过网络(互联网、3G网络等)将从用户处接收到的语音输入数据传输给云端。\n[0068] 云端系统32的云端数据传输模块320负责接收来自终端的语音输入数据,并由语音引擎322根据语音输入的数据识别其中的内容信息。\n[0069] 语音引擎322的语音识别技术是现有的技术。例如,语音引擎322包括语音采集装置、前端处理模块、特征提取模块、基音特征提取模块、声调识别模块、训练模块、声学层识别模块、拼音文法理解模块、语言理解模块九个部分,该声学层识别模块采用以状态的段长概率来表示的隐含马尔可夫模型,即基于段长分布的隐含马尔可夫模型,简称DDBHMM模型,该模型的段长服从具有凸性的分布,其中,该模型中的状态与语音中的音素或音节等语音单元相对应,而这些语音单元读音的语音信号特征作为对应语音单元的观测量;该训练模块的训练方法步骤如下:对训练模块输入一个或多个包含有若干特定词的读音样本文件,该文件中的每句话的一系列帧的特征向量以帧为单位,通过训练模块中的训练搜索算法,对每帧语音信号中的每个词的每个状态进行搜索比较,得到语音信号特征矢量的矢量量化码本(VQ码本)和该特定词的DDBHMM模型参数,输入给声学层识别模块;所述的汉语连续语音识别系统的语音识别方法步骤如下:通过语音采集装置接收人们的语音信号,对于输入的语音信号进行前端处理,并进行MFCC语音特征(基于Mel倒谱系数的语音特征,Mel-Frequency Cepstral Coefficients)序列的提取,得到的该MFCC语音特征序列被送入声学层识别模块,通过声学层识别模块的搜索算法,产生拼音格形式的识别结果,同时,语音信号的基音特征矢量也被提取出来,送入声调识别模块,声调识别模块利用基音特征信息和拼音的分割点信息,得到拼音的声调信息并加入到拼音格中,接着,通过拼音文法理解模块对拼音格进行修剪,精简后的音节格被送入语言理解模块,转化为拼音图和词图,并在词图中进行搜索,得到最后的理解结果。\n[0070] 例如,语音引擎能够识别出“今日下午3点提醒有会议”的具体内容,获知这是一个提醒事件,提醒的内容是“今日下午3点有会议”。\n[0071] 云端数据传输模块320负责将识别出的内容信息传输到终端系统30。\n[0072] 终端系统30的存储模块304存储传输来的内容信息。\n[0073] 提醒模块306根据识别出的内容信息进行提醒,提醒的内容为云端识别出并传输到终端的内容信息。\n[0074] 云端系统32识别出了这是一个提醒事件,且是提醒在今日下午3点有会议。因此,在今日下午3点的时刻,车载端触发一个提醒事件,并且通过语音提醒的方式来告知用户,即通过车载端上的音频播放设备(例如扬声器)播放“今日下午3点有会议”的内容。\n[0075] 从上述实施例中可以看出,接收语音输入、通过语音方式提醒用户都是在终端完成的(在本实施例中是车载终端),而语音识别是在云端完成的。\n[0076] 上述实施例是提供给本领域普通技术人员来实现或使用本实用新型的,本领域普通技术人员可在不脱离本实用新型的发明思想的情况下,对上述实施例做出种种修改或变化,因而本实用新型的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的最大范围。
法律信息
- 2021-01-19
专利权有效期届满
IPC(主分类): H04L 29/08
专利号: ZL 201020698052.8
申请日: 2010.12.31
授权公告日: 2011.08.03
- 2013-02-13
专利权的转移
登记生效日: 2013.01.14
专利权人由上海博泰悦臻电子设备制造有限公司变更为上海博泰悦臻电子设备制造有限公司
地址由200233 上海市中山西路1800号兆丰环球大厦2楼D1座变更为200233 上海市中山西路1800号兆丰环球大厦2楼D1座
专利权人变更为上海汽车集团股份有限公司
- 2011-08-03
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2012-03-05 | 2012-03-05 | | |
2 | | 2012-08-07 | 2012-08-07 | | |
3 | | 2011-12-28 | 2011-12-28 | | |
4 | | 2012-04-28 | 2012-04-28 | | |
5 | | 2011-11-15 | 2011-11-15 | | |
6 | | 2011-08-24 | 2011-08-24 | | |
7 | | 2013-12-11 | 2013-12-11 | | |
8 | | 2011-08-24 | 2011-08-24 | | |
9 | | 2010-12-31 | 2010-12-31 | | |
10 | | 2012-12-03 | 2012-12-03 | | |