用于便携式终端的语音处理方法及装置

发明专利有效专利

申请号：
CN201410450210.0
IPC分类号：G10L15/26;G06F17/30;H04L29/08
申请日期：
2014-09-04
申请人：
百度在线网络技术（北京）有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	用于便携式终端的语音处理方法及装置
申请号	CN201410450210.0	申请日期	2014-09-04
法律状态	暂无	申报国家	中国
公开/公告日	2014-12-03	公开/公告号	CN104183237A
优先权	暂无	优先权号	暂无
主分类号	G10L15/26 ? IPC结构图谱： G 物理 G0 仪器 G10 乐器；声学 G10L 语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码〔4〕 G10L15/00 语音识别（G10L 17/00优先）〔7，2013.01〕 G10L15/26 语音—正文识别系统（G10L 15/08优先）〔7〕	IPC分类号	G;1;0;L;1;5;/;2;6;;;G;0;6;F;1;7;/;3;0;;;H;0;4;L;2;9;/;0;8查看分类表>
申请人	百度在线网络技术（北京）有限公司	申请人地址	广东省深圳市南山区科技园高新中二道5号生产力大楼D单元三层301 变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	百度在线网络技术（北京）有限公司,百度国际科技(深圳)有限公司,百度在线网络技术(北京)有限公司	当前权利人	百度在线网络技术（北京）有限公司,百度国际科技(深圳)有限公司,百度在线网络技术(北京)有限公司
发明人	谢波;钟浩清;孙浩;朱举章;陈雪;杨格;吴泽武;林凯杰
代理机构	北京金律言科知识产权代理事务所（普通合伙）	代理人	罗延红;逯博

摘要

本发明提供一种用于便携式终端的语音处理方法及装置。所述语音处理方法包括：获取至少一条第一语音指令；将所述第一语音指令发送给云端；从云端下载第一语音指令集，所述第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合；根据下载的第一语音指令集更新本地的第二语音指令集。通过本发明提供一种用于便携式终端的语音处理方法及装置，实现扩大语音指令库的目的，有助于提高语音识别的命中率。

1.一种用于便携式终端的语音处理方法，其特征在于，所述语音处理方法包括：
获取至少一条第一语音指令；
将所述第一语音指令发送给云端；
从云端下载第一语音指令集，所述第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合，所述第二语音指令至少包括所述第一语音指令；
根据下载的第一语音指令集更新本地的第二语音指令集。
2.根据权利要求1所述的语音处理方法，其特征在于，所述语音处理方法还包括：从云端接收更新语音指令集的通知。
3.根据权利要求2所述的语音处理方法，其特征在于，所述从云端下载第一语音指令集的步骤包括：
响应于从云端接收的更新语音指令集的通知，从云端下载所述第一语音指令集。
4.根据权利要求1～3中任一项所述的语音处理方法，其特征在于，所述语音处理方法还包括：将更新的第二语音指令集加载到内存。
5.一种语音处理方法，其特征在于，所述语音处理方法包括，在云端执行以下步骤：
接收至少一条第一语音指令；
对所述第一语音指令进行语义解析，获得文字数据；
将所述文字数据匹配为文字指令；
将所述第一语音指令和匹配的文字指令存储到指令库；
生成包括在一段时间内新增的第一语音指令和匹配的文字指令的更新语音指令集。
6.根据权利要求5所述的语音处理方法，其特征在于，所述语音处理方法还包括：
向各个客户端广播用于更新语音指令集的通知。
7.根据权利要求6所述的语音处理方法，其特征在于，响应于客户端的下载请求，将所述更新语音指令集发送给所述客户端。
8.一种用于语音处理的便携式终端，其特征在于，所述便携式终端包括：
语音指令收集单元，用于获取至少一条第一语音指令；
语音指令发送单元，用于将语音指令收集单元获取的第一语音指令发送给云端；
更新指令集下载单元，用于从云端下载第一语音指令集，所述第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合，所述第二语音指令至少包括所述第一语音指令；
指令集更新单元，用于根据更新指令集下载单元下载的第一语音指令集更新本地的第二语音指令集。
9.根据权利要求8所述的便携式终端，其特征在于，所述便携式终端还包括：
更新通知接收单元，用于从云端接收更新语音指令集的通知。
10.根据权利要求9所述的便携式终端，其特征在于，更新指令集下载单元响应于更新通知接收单元从云端接收的更新语音指令集的通知，从云端下载所述第一语音指令集。
11.根据权利要求8～10中任一项所述的便携式终端，其特征在于，指令集更新单元还用于将更新的第二语音指令集加载到内存。
12.一种云端的语音处理装置，其特征在于，所述语音处理装置包括：
语音指令接收单元，用于接收至少一条语音指令；
语音指令解析单元，用于对语音指令接收单元接收的语音指令进行语义解析，获得文字数据；
指令匹配单元，用于将语音指令解析单元解析出的文字数据匹配为文字指令；
指令存储单元，用于将所述语音指令和匹配的文字指令存储到指令库；
更新指令集生成单元，用于生成包括在一段时间内新增的语音指令和匹配的文字指令的更新语音指令集。
13.根据权利要求12所述的语音处理装置，其特征在于，所述语音处理装置还包括：
更新通知发送单元，用于向各个客户端广播用于更新语音指令集的通知。
14.根据权利要求13所述的语音处理装置，其特征在于，所述语音处理装置还包括：
更新指令集发送单元，用于响应于客户端的下载请求，将所述更新语音指令集发送给所述客户端。

用于便携式终端的语音处理方法及装置\n技术领域\n[0001] 本发明涉及语音识别技术领域，尤其涉及一种用于便携式终端的语音处理方法及装置。\n背景技术\n[0002] 说话的语序、语义及用词等因人而异，从而制约语音指令库的更新，而语音识别命中率依赖于语音指令库的完善度，导致语音识别受到了语音指令库的限制，使得语音识别命中率较低。\n发明内容\n[0003] 本发明的目的在于提供一种用于便携式终端的语音处理方法及装置，通过便携式终端将其无法识别的语音指令上传给云端，云端基于上传的语音指令扩充指令库，便携式终端通过下载该语音指令库扩大本地语音指令集，从而无限地扩大语音指令集。\n[0004] 根据本发明的一方面，提供一种用于便携式终端的语音处理方法，包括：获取至少一条第一语音指令；将所述第一语音指令发送给云端；从云端下载第一语音指令集，所述第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合；根据下载的第一语音指令集更新本地的第二语音指令集。\n[0005] 根据本发明的一方面，提供一种语音处理方法，所述语音处理方法包括，在云端执行以下步骤：接收至少一条第一语音指令；对所述第一语音指令进行语义解析，获得文字数据；将所述文字数据匹配为文字指令；将所述第一语音指令和匹配的文字指令存储到指令库。\n[0006] 根据本发明的另一方面，提供一种用于语音处理的便携式终端，所述便携式终端包括：语音指令收集单元，用于获取至少一条第一语音指令；语音指令发送单元，用于将语音收集单元获取的第一语音指令发送给云端；更新指令集下载单元，用于从云端下载第一语音指令集，所述第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合；指令集更新单元，用于根据更新指令集下载单元下载的第一语音指令集更新本地的第二语音指令集。\n[0007] 根据本发明的另一方面，还提供一种云端的语音处理装置，所述语音处理装置包括：语音指令接收单元，用于接收至少一条语音指令；语音指令解析单元，用于对语音指令接收单元接收的语音指令进行语义解析，获得文字数据；指令匹配单元，用于将语音指令解析单元解析出的文字数据匹配为文字指令；指令存储单元，用于将所述语音指令和匹配的文字指令存储到指令库。\n[0008] 本发明的语音处理方法及装置，通过便携式终端收集语音指令，将该语音指令发送给云端，云端对该语音指令进行语义解析后更新至语音指令库，便携式终端通过下载更新后的语音指令库以更新本地语音指令库，从而可无限地扩大语音指令库，进而提高语音识别的命中率。\n附图说明\n[0009] 图1为本发明实施例的便携式终端侧的语音处理方法的流程图。\n[0010] 图2为本发明实施例的云端的语音处理方法的流程图。\n[0011] 图3为本发明实施例的便携式终端的语音处理装置的结构框图。\n[0012] 图4为本发明实施例的云端的语音处理装置的结构框图。\n具体实施方式\n[0013] 本发明的总体构思是，通过便携式终端收集其自身无法通过指令库识别的语音指令，将语音指令发送给云端；云端对该语音指令进行语义解析获得文字数据，将该文字数据匹配为文字指令，并将语音指令及匹配的文字指令存储至语音指令库；便携式终端通过下载该语音指令库更新本地的语音指令库，从而不断扩大和完善本地的语音指令库。\n[0014] 下面结合附图对本发明实施例一种用于便携式终端的语音处理方法及装置进行详细描述。\n[0015] 图1示出了本发明实施例的便携式终端侧的语音处理方法的流程图。\n[0016] 参照图1，在步骤S110，获取至少一条第一语音指令。所述第一语音指令通常可以是所述便携式终端无法识别或识别失败的语音指令。\n[0017] 在步骤S120，将在步骤S110获取的第一语音指令发送给云端。\n[0018] 便携式终端在执行语音识别的过程，将获取用户的语音信息，并将语音信息发送给云端。例如，用户在执行语音识别时，向便携式终端输入语音信息“今天温度怎么样”，便携式终端在接收到该语音信息后，将该语音信息“今天温度怎么样”发送给云端。\n[0019] 在步骤S130，从云端下载第一语音指令集，其中，第一语音指令集可包括第二语音指令及与其匹配的文字指令的集合。所述第二语音指令可以是在一段时间内从多个客户端发送给云端的第一语音指令。\n[0020] 云端在接收到便携式终端发送的语音信息后，将先对语音信息进行语音解析，将语音信息转换为文字数据信息，并对该文字数据信息匹配为文字指令。例如，便携式终端向云端发送“今天温度怎么样”的语音信息，云端将该信息转换为文字数据，“温度”通常意指“天气”，云端则将“温度”匹配为“天气”这一文字指令。\n[0021] 根据本发明的可选实施例，便携式终端可从云端接收用于更新语音指令集的通知，并且响应于从云端接收的更新语音指令集的通知，从云端下载所述第一语音指令集。本发明技术人员可以理解的是，便携式终端也可以主动访问云端，获取所述第一语音指令集，也可以在接收到通知后从云端下载所述第一语音指令集。\n[0022] 在步骤S140，根据在步骤S130下载的第一语音指令集更新本地的第二语音指令集。可选地，还将更新的第二语音指令集加载到内存。\n[0023] 由于每个便携式终端可上传其无法识别的语音指令，依赖云端进行语义解析等复杂运算并进行语音指令的更新，通过从云端下载基于多个终端更新的语音指令集，可无限地扩大本地语音指令库，提高便携式终端语音识别的命中率。\n[0024] 图2示出了本发明实施例的云端的语音处理方法的流程图。\n[0025] 参照图2，在步骤S210中，接收至少一条第一语音指令。\n[0026] 在步骤S220，将第一语音指令进行语义解析，获得文字数据。云端接收到便携式终端发送的语音信息后，将语音信息进行语义解析，把语音信息转换为文字数据信息。\n[0027] 在步骤S230，将文字数据匹配为文字指令。例如，响应于从便携式终端接收的语音信息“今天温度怎么样”，将该语音信息转为文字格式，“温度”通常意指“天气”，云端则将“温度”匹配为“天气”这一文字指令，可以理解为，“天气”为“温度”的文字指令。\n[0028] 在步骤S240，将第一语音指令与匹配的文字指令存储到指令库。\n[0029] 进一步地，云端生成包括在一段时间内新增的第一语音指令与匹配的文字指令的更新语音指令集，并向客户端广播用于更新指令集的通知，且响应于客户端的下载请求，将更新语音指令集发送给客户端，从而达到更新客户端指令库的目的。\n[0030] 通过本发明提供的语音处理方法，云端接收便携式终端不断搜集的语音信息，将语音信息发送给云端，通过云端语义解析处理及文字指令匹配，以实现扩大语音指令库的目的，进而提高语音识别命中率，增强用户体验。\n[0031] 本发明的另一方面，还提供一种应用上述语音处理方法的语音处理装置。\n[0032] 图3示出了本发明实施例的便携式终端的语音处理装置的结构框图。\n[0033] 参照图3，本发明实施例的便携式终端的语音处理装置包括：语音指令收集单元\n310、语音指令发送单元320、指令集下载单元330以及指令集更新单元340。\n[0034] 语音指令收集单元310用于获取至少一条第一语音指令。\n[0035] 语音指令发送单元320将语音指令收集单元310获取的第一语音指令发送给云端。\n[0036] 更新指令集下载单元330，用于从云端下载第一语音指令集，其中，第一语音指令集包括第二语音指令以及与其匹配的文字指令的集合。\n[0037] 具体地，便携式终端还包括更新通知接收单元，用于从云端接收更新语音指令集的通知，并将该通知发送至更新指令集下载单元330，更新指令集下载单元330响应于该通知，从云端下载第一语音指令集。\n[0038] 指令集更新单元340，用于根据更新指令集下载单元下载的第一语音指令集更新本地的第二语音指令集。进一步地，指令集更新单元340将更新的第二指令集加载到便携式终端的内存。\n[0039] 图4示出了本发明实施例的云端的语音处理装置的结构框图。\n[0040] 参照图4，本发明实施例的云端的语音处理装置包括：语音指令接收单元410、语音指令解析单元420、指令匹配单元430以及指令存储单元440。\n[0041] 语音指令接收单元410用于接收至少一条语音指令。语音指令接收单元410接收自便携式终端发送的语音指令，并将该语音指令发送至语音指令解析单元420。\n[0042] 语音指令解析单元420对语音指令接收单元接收410的语音指令进行语义解析，获得文字数据。语音指令解析单元420将接收的语音指令转换为文字数据信息，并将该文字数据信息发送给指令匹配单元430。\n[0043] 指令匹配单元430将语音指令解析单元420解析出的文字数据匹配为文字指令。例如，指令匹配单元430响应于从语音指令解析单元420接收的文字数据信息“今天温度怎么样”，“温度”通常意指“天气”，指令匹配单元430则将“温度”匹配为“天气”这一文字指令，可以理解为，“天气”为“温度”的文字指令。\n[0044] 指令存储单元440将语音指令和匹配的文字指令存储到指令库。\n[0045] 进一步地，云端的语音处理装置还包括更新指令集生成单元和更新通知发送单元。其中，更新指令集生成单元用于包括在一段时间内新增的语音指令和匹配的文字指令的更新语音指令集；更新通知发送单元，用于向各个客户端广播用于更新语音指令集的通知。\n[0046] 更进一步地，云端的语音处理装置还包括更新指令集发送单元，其用于响应于客户端的下载请求，将更新语音指令集发送给客户端。\n[0047] 本发明的语音处理方法及装置，通过便携式终端收集语音指令，将该语音指令发送给云端，云端对该语音指令进行语义解析后更新至语音指令库，便携式终端通过下载更新后的语音指令库以更新本地语音指令库，从而可无限地扩大语音指令库，有助于提高语音识别的命中率。\n[0048] 需要指出，根据实施的需要，可将本申请中描述的各个步骤拆分为更多步骤，也可将两个或多个步骤或者步骤的部分操作组合成新的步骤，以实现本发明的目的。\n[0049] 上述根据本发明的方法可在硬件、固件中实现，或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码，或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码，从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解，计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如，RAM、ROM、闪存等)，当所述软件或计算机代码被计算机、处理器或硬件访问且执行时，实现在此描述的处理方法。此外，当通用计算机访问用于实现在此示出的处理的代码时，代码的执行将通用计算机转换为用于执行在此示出的处理的专用计算机。\n[0050] 以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以所述权利要求的保护范围为准。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN103839549A	2014-06-04	2012-11-22	一种语音指令控制方法及系统无效专利	腾讯科技(深圳)有限公司
2	CN103956168A	2014-07-30	2014-03-29	一种语音识别方法、装置及终端无效专利	深圳创维数字技术股份有限公司;深圳市创维软件有限公司

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供