著录项信息
专利名称 | 语音控制方法及装置、语音响应方法及装置 |
申请号 | CN201210319278.6 | 申请日期 | 2012-08-31 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2012-12-26 | 公开/公告号 | CN102842306A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G10L15/02 | IPC分类号 | G;1;0;L;1;5;/;0;2;;;H;0;4;N;2;1;/;4;2;2查看分类表>
|
申请人 | 深圳TCL新技术有限公司 | 申请人地址 | 广东省深圳市南山区中山园路1001号TCL国际E城D4栋7楼
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 深圳TCL新技术有限公司 | 当前权利人 | 深圳TCL新技术有限公司 |
发明人 | 郭俊旺 |
代理机构 | 深圳市世纪恒程知识产权代理事务所 | 代理人 | 胡海国 |
摘要
本发明公开一种语音控制方法,包括:录制用户输入的控制语音,提取并记录控制语音的语音特征数据;录制用户对应控制语音的操作指令或应答语音;设置语音特征数据与操作指令或应答语音的关联,供用户自定义电子设备的语音操作控制指令。本发明还公开一种语音控制装置及对控制语音进行响应的语音响应方法及装置。本发明通过录制用户输入的控制语音,提取并记录控制语音的语音特征数据、录制该控制语音的操作指令或应答语音、设置语音特征数据与操作指令或应答语音的关联并对该控制语音进行响应的方法,具有用户可自定义语音识别控制并能和电视进行交流的有益效果,使电视拥有学习的功能,提高了电视性能,提升了用户体验。
1.一种语音控制方法,其特征在于,包括以下步骤:
录制用户输入的控制语音,提取并记录所述控制语音的语音特征数据;
录制用户对应所述控制语音的操作指令或应答语音;
设置所述语音特征数据与所述操作指令或应答语音的关联,供用户自定义电子设备的语音操作控制指令;
其中,录制用户对应所述控制语音的操作指令或应答语音的步骤包括:当判断为录制所述操作指令时,
显示应用程序列表,根据用户选择的应用程序,跟踪并记录遥控按键操作全过程所对应的遥控键值及应用程序索引。
2.如权利要求1所述的方法,其特征在于,所述录制用户输入的控制语音,提取并记录控制语音的语音特征数据的步骤具体包括:
将所述控制语音上传至云端服务器进行识别,提取所述语音特征数据;
接收根据所述语音特征数据转换得到可读的语音字符;
显示所述语音字符,在用户确认所述语音字符无误时记录所述语音字符或者源特征数据。
3.如权利要求1所述的方法,其特征在于,所述录制用户对应所述控制语音的操作指令或应答语音的步骤还包括:
当判断为录制所述应答语音时,
录制语音应答模式的同时获取用户输入的应答语音数据,并生成应答语音数据文件。
4.如权利要求2所述的方法,其特征在于,所述设置所述语音特征数据与所述操作指令或应答语音的关联的步骤具体包括:
根据录制的所述操作指令,建立所述应用程序索引、所述遥控键值与所述语音字符的对应关系并存储至数据库中;
或者,
根据录制的所述应答语音,建立所述语音字符或者特征数据与所述应答语音的对应关系,并存储至数据库中。
5.如权利要求4所述的方法,其特征在于,所述数据库包括操作指令应答语音库,所述操作指令应答语音库包括多个语音文件,所述语音文件关联对应的所述语音操作控制指令及应用程序索引。
6.一种语音控制装置,其特征在于,包括:
第一录制模块,用于录制用户输入的控制语音,提取并记录所述控制语音的语音特征数据;
第二录制模块,用于录制用户对应所述控制语音的操作指令或应答语音;
关联设置模块,用于设置所述语音特征数据与所述操作指令或应答语音的关联,供用户自定义电子设备的语音操作控制指令;
所述第二录制模块包括:
操作指令录制单元,用于在判断为录制所述操作指令时,
显示应用程序列表,根据用户选择的应用程序,跟踪并记录遥控按键操作全过程所对应的遥控键值及应用程序索引。
7.如权利要求6所述的装置,其特征在于,所述第一录制模块具体包括:
特征数据提取单元,用于将所述控制语音上传至云端服务器进行识别,提取所述语音特征数据;
语音字符获取单元,用于接收根据所述语音特征数据转换得到可读的语音字符;
记录单元,用于显示所述语音字符,在用户确认所述语音字符无误时记录所述语音字符或者源特征数据。
8.如权利要求6所述的装置,其特征在于,所述第二录制模块还包括:
应答语音录制单元,用于在判断为录制所述应答语音时,录制语音应答模式的同时获取用户输入的应答语音数据,并生成应答语音数据文件。
9.如权利要求7所述的装置,其特征在于,所述关联设置模块具体包括:
操作指令设置单元,用于根据录制的所述操作指令,建立所述应用程序索引、所述遥控键值与所述语音字符的对应关系并存储至数据库中;
应答语音设置单元,用于根据录制的所述应答语音,建立所述语音字符或者特征数据与所述应答语音的对应关系,并存储至数据库中。
10.如权利要求9所述的装置,其特征在于,所述数据库包括操作指令应答语音库,所述操作指令应答语音库包括多个语音文件,所述语音文件关联对应的所述语音操作控制指令及应用程序索引。
11.一种语音响应方法,所述响应方法包括对如权利要求1所述的语音控制方法中的控制语音进行响应的方法,其特征在于,所述响应方法包括以下步骤:
获取用户输入的控制语音,并提取控制语音特征数据;
检索语音字符数据库,判断在所述数据库中是否能够找到所述语音特征数据对应的应答方式;
若是,则根据所述应答方式进行应答;
若否,则切换至学习工作模式进行相应操作或提示用户重新输入语音指令;
所述根据所述应答方式进行应答的步骤包括:
判断所述应答方式所对应的操作类型;
在所述应答方式为操作应答时,执行所述操作应答指定的应用程序和/或对应的控制指令。
12.如权利要求11所述的响应方法,其特征在于,所述根据所述应答方式进行应答的步骤还包括:
在所述应答方式为语音应答时,播放对应的语音文件。
13.一种语音响应装置,所述响应装置包括对如权利要求6所述的语音控制装置进行控制,其特征在于,所述响应装置包括:
控制语音获取模块,用于获取用户输入的控制语音,并提取控制语音特征数据;
应答方式获取模块,用于检索语音字符数据库,判断在所述数据库中是否能够找到所述语音特征数据对应的应答方式;
第一应答模块,用于在所述数据库中能够找到所述语音特征数据对应的应答方式时,根据所述应答方式进行应答;
第二应答模块,用于在所述数据库中不能找到所述语音特征数据对应的应答方式时,切换至学习工作模式进行相应操作或提示用户重新输入语音指令;
所述第一应答模块包括:
应答类型获取单元,用于判断所述应答方式所对应的操作类型;
操作应答单元,用于在所述应答方式为操作应答时,执行所述操作应答指定的应用程序和/或对应的控制指令。
14.如权利要求13所述的装置,其特征在于,所述第一应答模块还包括:
语音应答单元,用于在所述应答方式为语音应答时,播放对应的语音文件。
语音控制方法及装置、语音响应方法及装置\n技术领域\n[0001] 本发明涉及智能电视语音识别控制技术领域,尤其涉及一种语音控制方法、装置及电视机。\n背景技术\n[0002] 现有技术的TV(Television,电视机)平台上只有个别应用程序可以使用语音控制功能,而且语音控制必须在某些特定场景下才可以起作用,比如必须进入某个应用界面,语音输入才会有作用。现有技术的语音控制所能完成的事情过于简单、单一,且只能完成出厂时预先设定好的个别操作,比如只能简单地切换频道、打开网址、天气预报等,用户不能添加新的语音控制功能,也不能删除用户自身认为不必要的语音控制功能;如果出厂时软件事先没有建立语音标示和相应操作的对应关系,则无法实现语音控制;用户的口语千差万别,现有技术方案往往因为固定的语音识别模式造成无法识别口音重的语音。目前TV系统的功能应用比较多,如果TV系统中只有个别应用才可以使用语音控制,那么语音控制功能将受到很大的限制,使TV系统的相关功能不能得到充分的利用,造成资源的浪费。\n发明内容\n[0003] 本发明的主要目的是提供一种语音控制方法、装置及电视机,旨在建立用户自定义的语音识别控制功能,使电视拥有学习的功能。\n[0004] 本发明公开了一种语音控制方法,包括以下步骤:\n[0005] 录制用户输入的控制语音,提取并记录控制语音的语音特征数据;\n[0006] 录制用户对应所述控制语音的操作指令或应答语音;\n[0007] 设置所述语音特征数据与所述操作指令或应答语音的关联,供用户自定义电子设备的语音操作控制指令。\n[0008] 优选地,所述录制用户输入的控制语音,提取并记录控制语音的语音特征数据的步骤具体包括:\n[0009] 将所述控制语音上传至云端服务器进行识别,提取所述语音特征数据;\n[0010] 接收根据所述语音特征数据转换得到可读的语音字符;\n[0011] 显示所述语音字符,在用户确认所述语音字符无误时记录所述语音字符或者源特征数据。\n[0012] 优选地,所述录制用户对应所述控制语音的操作指令或应答语音的步骤具体包括:\n[0013] 当判断为录制所述操作指令时,\n[0014] 显示应用程序列表,根据用户选择的应用程序,跟踪并记录遥控按键操作全过程所对应的遥控键值及应用程序索引;\n[0015] 当判断为录制所述应答语音时,\n[0016] 录制语音应答模式的同时获取用户输入的应答语音数据,并生成应答语音数据文件。\n[0017] 优选地,所述设置所述语音特征数据与所述操作指令或应答语音的关联的步骤具体包括:\n[0018] 根据录制的所述操作指令,建立所述应用程序索引、所述遥控键值与所述语音字符的对应关系并存储至数据库中;\n[0019] 或者\n[0020] 根据录制的所述应答语音,建立所述语音字符或者特征数据与所述应答语音的对应关系,并存储至数据库中。\n[0021] 优选地,所述数据库包括操作指令应答语音库,所述操作指令应答语音库包括多个语音文件,所述语音文件关联对应的所述语音操作控制指令及应用程序索引。\n[0022] 本发明还公开一种语音控制装置,包括:\n[0023] 第一录制模块,用于录制用户输入的控制语音,提取并记录控制语音的语音特征数据;\n[0024] 第二录制模块,用于录制用户对应所述控制语音的操作指令或应答语音;\n[0025] 关联设置模块,用于设置所述语音特征数据与所述操作指令或应答语音的关联,供用户自定义电子设备的语音操作控制指令。\n[0026] 优选地,所述第一录制模块具体包括:\n[0027] 特征数据提取单元,用于将所述控制语音上传至云端服务器进行识别,提取所述语音特征数据;\n[0028] 语音字符获取单元,用于接收根据所述语音特征数据转换得到可读的语音字符;\n[0029] 记录单元,用于显示所述语音字符,在用户确认所述语音字符无误时记录所述语音字符或者源特征数据。\n[0030] 优选地,所述第二录制模块具体包括:\n[0031] 操作指令录制单元,用于在判断为录制所述操作指令时,\n[0032] 显示应用程序列表,根据用户选择的应用程序,跟踪并记录遥控按键操作全过程所对应的遥控键值及应用程序索引;\n[0033] 应答语音录制单元,用于在判断为录制所述应答语音时,\n[0034] 录制语音应答模式的同时获取用户输入的应答语音数据,并生成应答语音数据文件。\n[0035] 优选地,所述关联设置模块具体包括:\n[0036] 操作指令设置单元,用于根据录制的所述操作指令,建立所述应用程序索引、所述遥控键值与所述语音字符的对应关系并存储至数据库中;\n[0037] 应答语音设置单元,用于根据录制的所述应答语音,建立所述语音字符或者特征数据与所述应答语音的对应关系,并存储至数据库中。\n[0038] 优选地,所述数据库包括操作指令应答语音库,所述操作指令应答语音库包括多个语音文件,所述语音文件关联对应的所述语音操作控制指令及应用程序索引。\n[0039] 本发明还公开一种语音响应方法,所述响应方法包括对所述的语音控制方法中的控制语音进行响应的方法,所述响应方法包括以下步骤:\n[0040] 获取用户输入的控制语音,并提取控制语音特征数据;\n[0041] 检索语音字符数据库,判断在所述数据库中是否能够找到所述语音特征数据对应的应答方式;\n[0042] 若是,则根据所述应答方式进行应答;\n[0043] 若否,则切换至学习工作模式进行相应操作或提示用户重新输入所述语音指令。\n[0044] 优选地,所述根据所述应答方式进行应答的步骤具体包括:\n[0045] 判断所述应答方式所对应的操作类型;\n[0046] 在所述应答方式为操作应答时,执行所述操作应答指定的应用程序和/或对应的控制指令;\n[0047] 在所述应答方式为语音应答时,播放对应的语音文件。\n[0048] 本发明还公开一种语音响应装置,所述响应装置包括对所述的语音控制装置进行控制,所述响应装置包括:\n[0049] 控制语音获取模块,用于获取用户输入的控制语音,并提取控制语音特征数据;\n[0050] 应答方式获取模块,用于检索语音字符数据库,判断在所述数据库中是否能够找到所述语音特征数据对应的应答方式;\n[0051] 第一应答模块,用于在所述数据库中能够找到所述语音特征数据对应的应答方式时,根据所述应答方式进行应答;\n[0052] 第二应答模块,用于在所述数据库中不能找到所述语音特征数据对应的应答方式时,切换至学习工作模式进行相应操作或提示用户重新输入所述语音指令。\n[0053] 优选地,所述第一应答模块具体包括:\n[0054] 应答类型获取单元,用于判断所述应答方式所对应的操作类型;\n[0055] 操作应答单元,用于在所述应答方式为操作应答时,执行所述操作应答指定的应用程序和/或对应的控制指令;\n[0056] 语音应答单元,用于在所述应答方式为语音应答时,播放对应的语音文件。\n[0057] 本发明通过录制用户输入的控制语音,提取并记录控制语音的语音特征数据、录制该控制语音的操作指令或应答语音、设置语音特征数据与操作指令或应答语音的关联并对该控制语音进行响应的方法,具有用户可自定义语音识别控制并能和电视进行交流的有益效果,使电视拥有学习的功能,提高了电视性能,提升了用户体验。\n附图说明\n[0058] 图1是本发明语音控制方法一实施例流程示意图;\n[0059] 图2是图1中语音识别一实施例结构框图;\n[0060] 图3是图1中录制用户输入的控制语音,提取并记录控制语音的语音特征数据一实施例流程示意图;\n[0061] 图4是图1中录制用户对应所述控制语音的操作指令或应答语音一实施例流程示意图;\n[0062] 图5是本发明语音控制装置一实施例结构示意图;\n[0063] 图6是图5中关联设置模块一实施例结构示意图;\n[0064] 图7是图5中第一录制模块一实施例结构示意图;\n[0065] 图8是图5中第二录制模块一实施例结构示意图;\n[0066] 图9是本发明语音响应方法一实施例流程示意图;\n[0067] 图10是图9中根据应答方式进行应答一实施例流程示意图;\n[0068] 图11是本发明语音响应装置一实施例结构示意图;\n[0069] 图12是图11中第一应答模块一实施例结构示意图。\n[0070] 本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。\n具体实施方式\n[0071] 以下结合说明书附图及具体实施例进一步说明本发明的技术方案。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。\n[0072] 参照图1,图1是本发明语音控制方法一实施例流程示意图;如图1所示,本发明语音控制方法包括以下步骤:\n[0073] 步骤S01、录制用户输入的控制语音,提取并记录控制语音的语音特征数据;\n[0074] 在一优选的实施例中,在TV主程序中设置有语音控制开关,默认情况下语音控制不起作用,在TV主程序打开该语音控制功能后TV才启动语音控制,语音功能启动后进入对话工作模式。在对话模式下,录制用户通过麦克风、语音遥控器或手机等语音输入设备输入的控制语音,同时提取并记录该控制语音对应的语音特征数据。在一优选的实施例中,TV将用户输入的控制语音上传至云端服务器进行识别,提取语音特征数据;参照图2,图2是图1中语音识别一实施例结构框图;如图2所示,TV将用户输入的语音进行录制后上传至云端语音识别服务器,该云端语音识别服务器对语音进行识别后转换为能够被TV识别的语音字符,TV将该语音字符通过OSD(On Screen Display,屏幕菜单式显示)或者其他显示方式显示出来供用户核对确认,用户核对无误后,TV记录该语音字符或者源特征数据;本实施例中,所述特征数据包括所述语音字符。\n[0075] 步骤S02、录制用户对应所述控制语音的操作指令或应答语音;\n[0076] 提取并记录用户输入的控制语音所对应的语音特征数据后,TV还需录制该控制语音所对应的操作指令或应答语音;具体地,在一优选的实施例中,电视机首先判断用户选择的语音控制类型;若用户选择的控制类型为“说话”时,电视机存储用户输入的语音,建立该语音的语音路径与相应语音字符之间的对应关系并存储至所述数据库。若用户选择的控制类型为“办事”时,电视机显示应用程序列表,根据用户选择的应用程序,跟踪并记录遥控按键操作全过程所对应的遥控键值及应用程序索引;并在应用程序索引、遥控键值与语音字符之间建立对应关系并存储至所述数据库。\n[0077] 步骤S03、设置所述语音特征数据与所述操作指令或应答语音的关联,供用户自定义电子设备的语音操作控制指令。\n[0078] 为了实现用户自定义电子设备的语音操作控制指令,设置语音特征数据与操作指令的关联具体为:根据录制的操作指令,建立应用程序索引、遥控键值与语音字符的对应关系并存储至数据库中;设置语音特征数据与应答语音的关联具体为:根据录制的应答语音,建立语音字符或者特征数据与应答语音的对应关系,并存储至数据库中。\n[0079] 在一优选的实施例中,数据库存储并检索云端返回的语音字符,相比存储检索语音音频文件更加简单、准确。当然,所述数据库存储在云端服务器,数据量小,因此本地硬件的开销也小,可更准确检索音频文件或者语音字符,这里不作限制。\n[0080] 下面以具体的实施例来描述本发明语音控制方法的具体实施过程。\n[0081] 比如要实现“打开U盘播放电影”的语音控制。用户首先进入学习模式,学习所接收的指令。电视会提示用户输入语音指令,用户通过麦克风将“打开U盘播放电影”的语音输入给电视,电视通过云端处理转换为文字字符,并以OSD提示的方式反馈给用户“您输入的是否为‘打开U盘播放电影’?”。用户选择“是”,然后就进入学习的第二步,OSD进一步提示“学习说话还是办事?”用户选择“办事”,则有OSD继续提示用户,“请选择您要打开的应用”。然后用户选择“USB应用”,当程序进入USB应用后,接下来的所有遥控器按键将会被一一记录,则用户就可以模拟进入USB应用后,如何用遥控器一步步选择所要播放的影片并实现播放。\n用户就完成自己想要功能的设置后,选择退出学习模式的按键。根据提示保存学习的内容,如“ 打开U盘播放电影”的文字字符和USB应用程序的索引以及上/下/左/右等一系列遥控按键的键值。此外,通过上述方法还可以“教”电视去说话,比如用户进入学习模式后录入一段自己的语音,并将录入的语音与语音字符关联地存储在数据库中,则电视便可以“鹦鹉学舌”般的说话,也可以智能应答了。\n[0082] 本实施例通过录制用户输入的控制语音,提取并记录控制语音的语音特征数据、录制该控制语音的操作指令或应答语音、设置语音特征数据与操作指令或应答语音的关联并对该控制语音进行响应的方法,具有用户可自定义语音识别控制并能和电视进行交流的有益效果,使电视拥有学习的功能,提高了电视性能,提升了用户体验。\n[0083] 参照图3,图3是图1中录制用户输入的控制语音,提取并记录控制语音的语音特征数据一实施例流程示意图;本实施例仅对步骤S01作进一步描述,本发明语音控制方法所涉及的其他步骤请参照相关实施例的具体描述,在此不再赘述。\n[0084] 如图3所示,本发明语音控制方法中,步骤S01、录制用户输入的控制语音,提取并记录控制语音的语音特征数据的步骤具体包括:\n[0085] 步骤S11、将所述控制语音上传至云端服务器进行识别,提取所述语音特征数据;\n[0086] 步骤S12、接收根据所述语音特征数据转换得到可显示的文字字符,即语音字符;\n[0087] 步骤S13、显示所述语音字符,在用户确认所述语音字符无误时记录所述语音字符或者源特征数据。\n[0088] TV将用户输入的控制语音上传至云端服务器进行识别,提取语音特征数据; TV将用户输入的语音进行录制后上传至云端语音识别服务器,该云端语音识别服务器对语音进行识别后转换为能够被TV识别的语音字符,TV将该语音字符通过OSD或者通过其他显示方式显示出来供用户核对确认,用户核对无误后,TV记录该语音字符或者源特征数据;本实施例中,所述特征数据包括所述语音字符。上述具体实施过程请参照图2所述实施例的具体描述,在此不再赘述。\n[0089] 本实施例通过录制用户输入的控制语音,提取并记录控制语音的语音特征数据的方法,具有更准确的用户可自定义语音识别控制的有益效果。\n[0090] 参照图4,图4是图1中录制用户对应控制语音的操作指令或应答语音一实施例流程示意图;本实施例仅对步骤S02作进一步描述,本发明语音控制方法所涉及的其他步骤请参照相关实施例的具体描述,在此不再赘述。\n[0091] 如图4所示,本发明语音控制方法中,步骤S02、录制用户对应所述控制语音的操作指令或应答语音的步骤具体包括:\n[0092] 步骤S21、判断所录制是操作指令还是应答语音;若是操作指令,则执行步骤S22;\n若是应答语音,则执行步骤S23;\n[0093] 步骤S22、显示应用程序列表,根据用户选择的应用程序,跟踪并记录遥控按键操作全过程所对应的遥控键值及应用程序索引;\n[0094] 在判断为录制操作指令时,TV显示应用程序列表,根据用户选择的应用程序,跟踪并记录遥控按键操作全过程所对应的遥控键值及应用程序索引。具体地,在一优选的实施例中,当TV判断用户选择“办事”即录制操作指令时,则有OSD继续提示用户,“请选择您要打开的应用”。然后用户选择“USB应用”,当程序进入USB应用后,接下来的所有遥控器按键将会被一一记录,则用户就可以模拟进入USB应用后,如何用遥控器一步步选择所要播放的影片并实现播放。用户就完成自己想要功能的设置后,选择退出学习模式的按键。根据提示保存学习的内容,如“ 打开U盘播放电影”的文字字符和USB应用程序的索引以及上/下/左/右等一系列遥控按键的键值。\n[0095] 步骤S23、录制语音应答模式的同时获取用户输入的应答语音数据,并生成应答语音数据文件。\n[0096] 在判断为录制应答语音时,TV将录制语音应答模式的同时,获取用户输入的应答语音数据,并生成应答语音数据文件。具体地,在一优选的实施例中,在用户进入学习模式后录入一段自己的语音时,TV将用户录入的语音与语音字符关联地存储在数据库中,则TV便可以“鹦鹉学舌”般的说话了。当然所述的应答语音只要与控制语音有逻辑关系,即可实现智能应答。例如,控制语音为“遥控器放哪里”,应答语音可以是“在电视柜下抽屉里”。这样当其他家庭成员向电视问 “遥控器放哪里”的时候,智能电视能智能应答“在电视柜下抽屉里”。\n[0097] 本实施例通过录制用户对应所述控制语音的操作指令或应答语音的方法,具有用户能和电视进行交流的有益效果,使电视更具智能化和人性化。\n[0098] 参照图5,图5是本发明语音控制装置一实施例结构示意图;如图5所示,本发明语音控制装置具体包括:\n[0099] 第一录制模块01,用于录制用户输入的控制语音,提取并记录控制语音的语音特征数据;\n[0100] 在一优选的实施例中,在TV主程序中设置有语音控制开关,默认情况下语音控制不起作用,在TV主程序打开该语音控制功能后TV才启动语音控制,语音功能启动后进入对话工作模式。在对话模式下,第一录制模块01录制用户通过麦克风、语音遥控器或手机等语音输入设备输入的控制语音,同时提取并记录该控制语音对应的语音特征数据。在一优选的实施例中,第一录制模块01将用户输入的控制语音上传至云端服务器进行识别,提取语音特征数据;具体地,第一录制模块01将用户输入的语音进行录制后上传至云端语音识别服务器,该云端语音识别服务器对语音进行识别后转换为能够被TV识别的语音字符,第一录制模块01将该语音字符通过OSD或者其他显示方式显示出来供用户核对确认,用户核对无误后,第一录制模块01记录该语音字符或者源特征数据;本实施例中,所述特征数据包括所述语音字符。上述实施过程请参照图2所述实施例的具体描述,在此不再赘述。\n[0101] 第二录制模块02,用于录制用户对应所述控制语音的操作指令或应答语音;\n[0102] 第一录制模块01提取并记录用户输入的控制语音所对应的语音特征数据后,第二录制模块02还需录制该控制语音所对应的操作指令或应答语音;具体地,在一优选的实施例中,第二录制模块02首先判断用户选择的语音控制类型;若用户选择的控制类型为“说话”时,第二录制模块02存储用户输入的语音,建立该语音的语音路径与相应语音字符之间的对应关系并存储至所述数据库。若用户选择的控制类型为“办事”时,第二录制模块02显示应用程序列表,根据用户选择的应用程序,跟踪并记录遥控按键操作全过程所对应的遥控键值及应用程序索引;并在应用程序索引、遥控键值与语音字符之间建立对应关系并存储至所述数据库。\n[0103] 关联设置模块03,用于设置所述语音特征数据与所述操作指令或应答语音的关联,供用户自定义电子设备的语音操作控制指令。\n[0104] 为了实现用户自定义电子设备的语音操作控制指令,需要关联设置模块03设置语音特征数据与操作指令或应答语音的关联。参照图6,图6是图5中关联设置模块一实施例结构示意图;如图6所示,关联设置模块03具体包括:\n[0105] 操作指令设置单元031,用于根据录制的所述操作指令,建立所述应用程序索引、所述遥控键值与所述语音字符的对应关系并存储至数据库中;\n[0106] 应答语音设置单元032,用于根据录制的所述应答语音,建立所述语音字符或者特征数据与所述应答语音的对应关系,并存储至数据库中。\n[0107] 关联设置模块03设置语音特征数据与操作指令的关联具体为:\n[0108] 若设置所述语音特征数据与操作指令的关联,则操作指令设置单元031根据录制的操作指令,建立应用程序索引、遥控键值与语音字符的对应关系并存储至数据库中;\n[0109] 若设置语音特征数据与应答语音的关联,则应答语音设置单元032根据录制的应答语音,建立语音字符或者特征数据与应答语音的对应关系,并存储至数据库中。\n[0110] 在一优选的实施例中,数据库存储并检索云端返回的语音字符,相比存储检索语音音频文件更加简单、准确。当然,所述数据库存储在云端服务器,数据量小,因此本地硬件的开销也小,可更准确检索音频文件或者语音字符,这里不作限制。\n[0111] 下面以具体的实施例来描述本发明语音控制装置进行语音控制的具体实施过程。\n[0112] 比如要实现“打开U盘播放电影”的语音控制。用户首先进入学习模式,学习所接收的指令。电视会提示用户输入语音指令,用户通过麦克风将“打开U盘播放电影”的语音输入给电视,电视的语音控制装置通过云端处理转换为文字字符,并以OSD提示的方式反馈给用户“您输入的是否为‘打开U盘播放电影’?”。用户选择“是”,然后就进入学习的第二步,OSD进一步提示“学习说话还是办事?”用户选择“办事”,则有OSD继续提示用户,“请选择您要打开的应用”。然后用户选择“USB应用”,当程序进入USB应用后,接下来的所有遥控器按键将会被一一记录,则用户就可以模拟进入USB应用后,如何用遥控器一步步选择所要播放的影片并实现播放。用户就完成自己想要功能的设置后,选择退出学习模式的按键。根据语音控制装置提示保存学习的内容,如“ 打开U盘播放电影”的文字字符和USB应用程序的索引以及上/下/左/右等一系列遥控按键的键值。此外,语音控制装置通过上述方法还可以“教”电视去说话,比如用户进入学习模式后录入一段自己的语音,并将录入的语音与语音字符关联地存储在数据库中,则电视便可以“鹦鹉学舌”,智能应答般的说话了。\n[0113] 本实施例通过录制用户输入的控制语音,提取并记录控制语音的语音特征数据、录制该控制语音的操作指令或应答语音、设置语音特征数据与操作指令或应答语音的关联并对该控制语音进行响应,具有用户可自定义语音识别控制并能和电视进行交流的有益效果,使电视拥有学习的功能,提高了电视性能,提升了用户体验。\n[0114] 参照图7,图7是图5中第一录制模块一实施例结构示意图;本实施例仅对第一录制模块01作进一步描述,本发明语音控制装置所涉及的其他模块请参照相关实施例的具体描述,在此不再赘述。\n[0115] 如图7所示,本发明语音控制装置中,第一录制模块01具体包括:\n[0116] 特征数据提取单元011,用于将所述控制语音上传至云端服务器进行识别,提取所述语音特征数据;\n[0117] 语音字符获取单元012,用于接收根据所述语音特征数据转换得到可显示的文字字符,以下简称语音字符;\n[0118] 记录单元013,用于显示所述语音字符,在用户确认所述语音字符无误时记录所述语音字符或者源特征数据。\n[0119] TV的特征数据提取单元011将用户输入的控制语音上传至云端服务器进行识别,提取语音特征数据;特征数据提取单元011将用户输入的语音进行录制后上传至云端语音识别服务器,该云端语音识别服务器对语音进行识别后转换为能够被TV识别的语音字符,语音字符获取单元012获取该语音字符,记录单元013将该语音字符通过OSD或者通过其他显示方式显示出来供用户核对确认,用户核对无误后,记录单元013记录该语音字符或者源特征数据;本实施例中,所述特征数据包括所述语音字符。上述具体实施过程请参照图2所述实施例的具体描述,在此不再赘述。\n[0120] 本实施例通过录制用户输入的控制语音,提取并记录控制语音的语音特征数据,具有用户可自定义语音识别控制的有益效果。\n[0121] 参照图8,图8是图5中第二录制模块一实施例结构示意图;本实施例仅对第二录制模块02作进一步描述,本发明语音控制装置所涉及的其他模块请参照相关实施例的具体描述,在此不再赘述。\n[0122] 如图8所示,本发明语音控制装置中,第二录制模块02具体包括:\n[0123] 操作指令录制单元021,用于在判断为录制所述操作指令时,显示应用程序列表,根据用户选择的应用程序,跟踪并记录遥控按键操作全过程所对应的遥控键值及应用程序索引;\n[0124] 在判断为录制操作指令时,操作指令录制单元021显示应用程序列表,根据用户选择的应用程序,跟踪并记录遥控按键操作全过程所对应的遥控键值及应用程序索引。具体地,在一优选的实施例中,当TV判断用户选择“办事”即录制操作指令时,则有OSD继续提示用户,“请选择您要打开的应用”。然后用户选择“USB应用”,当程序进入USB应用后,接下来的所有遥控器按键将会被一一记录,则用户就可以模拟进入USB应用后,如何用遥控器一步步选择所要播放的影片并实现播放。用户就完成自己想要功能的设置后,选择退出学习模式的按键。根据操作指令录制单元021提示保存学习的内容,如“ 打开U盘播放电影”的文字字符和USB应用程序的索引以及上/下/左/右等一系列遥控按键的键值。\n[0125] 应答语音录制单元022,用于在判断为录制所述应答语音时,录制语音应答模式的同时获取用户输入的应答语音数据,并生成应答语音数据文件。\n[0126] 在判断为录制应答语音时,应答语音录制单元022将录制语音应答模式的同时,获取用户输入的应答语音数据,并生成应答语音数据文件。具体地,在一优选的实施例中,在用户进入学习模式后录入一段自己的语音时,应答语音录制单元022将用户录入的语音与语音字符关联地存储在数据库中,则TV便可以“鹦鹉学舌”般的说话了。当然所述的应答语音只要与控制语音有逻辑关系,即可实现智能应答。例如,控制语音为“遥控器放哪里”,应答语音可以是“在电视柜下抽屉里”。这样当其他家庭成员向电视问 “遥控器放哪里”的时候,智能电视能智能应答“在电视柜下抽屉里”。\n[0127] 本实施例通过录制用户对应所述控制语音的操作指令或应答语音,具有用户能和电视进行交流的有益效果,使电视更具智能化和人性化。\n[0128] 参照图9,图9是本发明语音响应方法一实施例流程示意图;本发明语音响应方法包括对上述语音控制方法中的控制语音进行响应的方法,如图9所示,本发明语音响应方法包括以下步骤:\n[0129] 步骤S101、获取用户输入的控制语音,并提取控制语音特征数据;\n[0130] 在对话模式下,用户通过麦克风、语音遥控器或手机等语音输入设备输入语音信息,TV获取用户输入的控制语音,并提取该控制语音所对应的控制语音特征数据;具体地,在一优选的实施例中,用户输入的语音信息通过云端服务器的语音识别系统识别后,将该语音文件转换为语音字符,所述语音字符包括文字字符等一切能够被TV识别的字符;所述控制语音特征数据包括所述语音字符。上述具体实施过程请参照图2所述实施例的具体描述,在此不再赘述。\n[0131] 步骤S102、检索语音字符数据库,判断在所述数据库中是否能够找到所述语音特征数据对应的应答方式;若是,则执行步骤S103;若否,则执行步骤S104;\n[0132] 步骤S103、根据所述应答方式进行应答;\n[0133] 步骤S104、切换至学习工作模式进行相应操作或提示用户重新输入所述语音指令。\n[0134] 根据语音字符建立的索引,检索语音字符数据库,在数据库中寻找对应的应答方式。如果能够在数据库中找到该语音字符的应答方式,则根据该应答方式进行应答。如果是操作,那么就进入其所指定的应用程序完成相关操作;如果是语音应答,则播放对应的语音文件。如果没有在数据库中找到该语音字符的应答方式,则在OSD上提示用户重试或者进入学习模式。\n[0135] 具体地,电视默认的工作模式是对话模式,在对话模式下,通过麦克风对电视讲“打开U盘播放电影”,电视机会自动将输入的语音通过云端语音识别为相应文字字符,然后到本地数据库中搜索“打开U盘播放电影”的字符,如果找到相关记录,则执行与之相匹配的操作如启动USB(Universal Serial Bus,通用串行总线)应用程序并发送一系列键值消息给电视,这样就可以实现用户所要的功能了。如果数据库中没有找到相关字符,则说明没有建立此语言控制功能或语音识别有误,则提示用户重新输入或进入学习模式。\n[0136] 本发明语音控制方法可以遍历所有的应用程序,以及用遥控器模拟进入应用程序内部的操作,因此用户还可以模拟出更多的操作比如编辑节目、预约节目、音量加减、更换频道、定时关机、查看某城市的天气预报、登陆某网站等。用户按照上述方法对TV进行相应设置,即可“教会”电视去做了。\n[0137] 本实施例通过启动语音功能进入对话工作模式,在用户确认无误后记录由输入的语音指令转换后得到的语音字符,在语音字符数据库中找到该语音字符的应答方式时,根据该应答方式进行应答,在没有找到时,切换至学习工作模式进行相应操作或提示用户重新输入该语音指令的方法,具有用户可以自定义语音识别控制并可以和电视进行交流的有益效果,使电视拥有学习的功能,提高了电视性能,提升了用户体验。\n[0138] 参照图10,图10是图9中根据应答方式进行应答一实施例流程示意图;本实施例仅对步骤S103作具体描述,本发明语音响应方法所涉及的其他步骤,请参照相关实施例的具体描述,在此不再赘述。\n[0139] 如图10所示,本发明语音响应方法中,步骤S103、根据所述应答方式进行应答具体包括:\n[0140] 步骤S31、判断所述应答方式所对应的操作类型;在所述应答方式为操作应答时,执行步骤S32;在所述应答方式为语音应答时,执行步骤S33;\n[0141] 步骤S32、执行所述操作应答指定的应用程序和/或对应的控制命令;\n[0142] 步骤S33、播放对应的语音文件。\n[0143] 如果能够在数据库中找到该语音字符的应答方式,则根据该应答方式进行应答。\n如果是操作即“办事”,那么就进入其所指定的应用程序完成相关操作;如果是语音应答即“说话”,则播放对应的语音文件。具体地,比如,若该操作应答为“打开U盘播放电影”,则电视机就执行该应答指定的应用程序,即电视机自动打开U盘,并播放电影;若是语音应答,则电视机根据该语音字符关联的语音路径播放相应的语音,如播放用户事先录入的语音“你真的很棒”。\n[0144] 本实施例通过判断应答方式所对应的操作类型是操作还是语音、并根据应答方式进行对应的应答的方法,具有将电视机智能化的有益效果。\n[0145] 参照图11,图11是本发明语音响应装置一实施例结构示意图;本实施例所述的语音响应装置包括对上述语音控制装置进行控制,如图11所示,本发明语音响应装置包括:\n[0146] 控制语音获取模块10,用于获取用户输入的控制语音,并提取控制语音特征数据;\n[0147] 在对话模式下,用户通过麦克风、语音遥控器或手机等语音输入设备输入语音信息,TV的控制语音获取模块10获取用户输入的控制语音,并提取该控制语音所对应的控制语音特征数据;具体地,在一优选的实施例中,用户输入的语音信息通过云端服务器的语音识别系统识别后,将该语音文件转换为语音字符,所述语音字符包括文字字符等一切能够被TV识别的字符;所述控制语音特征数据包括所述语音字符。上述具体实施过程请参照图2所述实施例的具体描述,在此不再赘述。\n[0148] 应答方式获取模块20,用于检索语音字符数据库,判断在所述数据库中是否能够找到所述语音特征数据所对应的应答方式;\n[0149] 第一应答模块30,用于在所述数据库中能够找到所述语音特征数据对应的应答方式时,根据所述应答方式进行应答;\n[0150] 第二应答模块40,用于在所述数据库中不能找到所述语音特征数据对应的应答方式时,切换至学习工作模式进行相应操作或提示用户重新输入所述语音指令。\n[0151] 根据语音字符建立的索引,应答方式获取模块20检索语音字符数据库,在数据库中寻找对应的应答方式。应答方式获取模块20如果能够在数据库中找到该语音字符的应答方式,则第一应答模块30根据该应答方式进行应答。如果是操作,那么第一应答模块30就进入其所指定的应用程序完成相关操作;如果是语音应答,则第一应答模块30播放对应的语音文件。如果应答方式获取模块20没有在数据库中找到该语音字符的应答方式,则在OSD上提示用户重试或者由第二应答模块40切换进入学习模式。\n[0152] 具体地,电视默认的工作模式是对话模式,在对话模式下,通过麦克风对电视讲“打开U盘播放电影”,电视机会自动将输入的语音通过云端语音识别为相应语音字符,控制语音获取模块10记录该语音字符,然后由应答方式获取模块20到本地数据库中搜索“打开U盘播放电影”的字符,如果应答方式获取模块20找到相关记录,则第一应答模块30执行与之相匹配的操作如启动USB应用程序并发送一系列键值消息给电视,这样就可以实现用户所要的功能了。如果应答方式获取模块20在数据库中没有找到相关字符,则说明没有建立此语言控制功能或语音识别有误,则提示用户重新输入或由第二应答模块40切换进入学习模式。\n[0153] 本发明语音控制装置通过上述语音控制方法可以遍历所有的应用程序,以及用遥控器模拟进入应用程序内部的操作,因此用户还可以模拟出更多的操作比如编辑节目、预约节目、音量加减、更换频道、定时关机、查看某城市的天气预报、登陆某网站等。用户按照上述方法对TV进行相应设置,即可“教会”电视去做了。\n[0154] 本实施例通过启动语音功能进入对话工作模式,在用户确认无误后记录由输入的语音指令转换后得到的语音字符,在语音字符数据库中找到该语音字符的应答方式时,根据该应答方式进行应答,在没有找到时,切换至学习工作模式进行相应操作或提示用户重新输入该语音指令,具有用户可以自定义语音识别控制并可以和电视进行交流的有益效果,使电视拥有学习的功能,提高了电视性能,提升了用户体验。\n[0155] 参照图12,图12是图11中对话工作模块一实施例结构示意图;本实施例仅将第一应答模块30作进一步描述,本发明语音控制装置所涉及的其他模块请参照相关实施例的具体描述,在此不再赘述。\n[0156] 如图12所示,本发明语音控制装置中,第一应答模块30具体包括:\n[0157] 应答类型获取单元301,用于判断所述应答方式所对应的操作类型;\n[0158] 操作应答单元302,用于在所述应答方式为操作应答时,执行所述操作应答指定的应用程序和/或对应的控制指令;\n[0159] 语音应答单元303,用于在所述应答方式为语音应答时,播放对应的语音文件。\n[0160] 如果应答方式获取模块20能够在数据库中找到该语音字符的应答方式,则应答类型获取单元301判断该应答方式所对应的操作类型并根据该应答方式进行应答。如果应答类型获取单元301判断该应答方式为操作应答即“办事”,那么操作应答单元302就进入其所指定的应用程序完成相关操作;如果应答类型获取单元301判断该应答方式为语音应答即“说话”,则语音应答单元303播放对应的语音文件。具体地,比如,若应答类型获取单元301判断该操作应答为“打开U盘播放电影”,则电视机的操作应答单元302就执行该应答指定的应用程序,即电视机自动打开U盘,并播放电影;若应答类型获取单元301判断该操作应答为语音应答,则电视机的语音应答单元303根据该语音字符关联的语音路径播放相应的语音,如播放用户事先录入的语音“你真的很棒”。\n[0161] 本实施例通过判断应答方式所对应的操作类型是操作还是语音、并根据应答方式进行对应的应答,具有将电视机智能化的有益效果。\n[0162] 以上所述仅为本发明的优选实施例,并非因此限制其专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
法律信息
- 2016-05-04
- 2013-09-04
实质审查的生效
IPC(主分类): G10L 15/02
专利申请号: 201210319278.6
申请日: 2012.08.31
- 2012-12-26
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-11-21
|
2007-04-18
| | |
2
| |
2011-04-27
|
2010-12-31
| | |
3
| | 暂无 |
2009-09-23
| | |
4
| |
2010-08-04
|
2009-12-15
| | |
5
| |
2011-01-05
|
2010-08-31
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |