著录项信息
专利名称 | 语音控制电视机的方法、装置和系统 |
申请号 | CN201110122756.X | 申请日期 | 2011-05-12 |
法律状态 | 暂无 | 申报国家 | 暂无 |
公开/公告日 | 2011-09-21 | 公开/公告号 | CN102196207A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04N21/422 | IPC分类号 | H;0;4;N;2;1;/;4;2;2;;;G;1;0;L;1;5;/;2;6查看分类表>
|
申请人 | 深圳市子栋科技有限公司 | 申请人地址 | 四川省成都市双流区西南航空港经济开发区怡心街道华府大道四段777号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 成都车音智能科技有限公司 | 当前权利人 | 成都车音智能科技有限公司 |
发明人 | 沈嘉鑫;王力劭;许军;庞泽耀;王力勃 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明公开一种语音控制电视机的方法、装置和系统,涉及语音服务技术。以解决用户通过遥控装置按键控制电视机的操作复杂的问题。在用户按下启动语音录入键以后,指示控制装置与云计算平台服务器建立通信连接,接收用户发遥控装置送的语音命令,将语音命令发送给控制装置;控制装置,将语音命令发送给云计算平台服务器,接收云计算平台服务器返回的电视机控制信息,根据电视机控制信息对电视机进行控制。本发明实施例提供的技术方案可以应用在智能家电领域中,实现对电视机的语音智能控制。
1.一种语音控制电视机的系统,包括:遥控装置和控制装置,其中,所述遥控装置用于接收用户发送的语音命令,将所述语音命令发送给所述控制装置,所述控制装置用于接收所述语音命令,根据所述语音命令对电视机进行控制;
其特征在于,还包括位于网络侧的云计算平台服务器;
所述遥控装置还用于在用户按下启动语音录入键以后,指示所述控制装置与云计算平台服务器建立通信连接;
所述控制装置还用于与云计算平台服务器建立通信连接,将所述语音命令通过所述通信连接发送给云计算平台服务器,接收所述云计算平台服务器返回的电视机控制信息,根据所述电视机控制信息对电视机进行控制;
所述云计算平台服务器,包括非特定人语音识别模块和多种广谱语音特征库,所述云计算平台服务器用于接收所述控制装置发送的语音命令,通过所述非特定人语音识别模块和多种广谱语音特征库对所述语音命令进行识别、解析,获取所述语音命令对应的电视机控制信息,将所述电视机控制信息发送给所述控制装置;
其中,所述广谱语音特征库是通过采集全中国各地、各种人以及这些人在不同环境、不同噪音背景下的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有语音特征库的信息,而不依赖于特定人的语音特征训练结果。
2.根据权利要求1所述的系统,其特征在于,
所述遥控装置,还用于在用户按下启动语音录入键的同时,向所述控制装置发送电视机静音指示;
所述控制装置,还用于接收所述电视机静音指示,根据该电视机静音指示启动所述电视机的静音功能。
3.根据权利要求1所述的系统,其特征在于,所述系统还包括:媒体数据库,用于存储媒体数据;
所述云计算平台服务器,还用于如果所述语音命令指示用户进行视频点播,从所述媒体数据库中获取所述语音命令指示的视频点播节目数据,将所述视频点播节目数据发送给所述控制装置;
所述控制装置,还用于接收所述视频点播节目数据,根据所述电视机控制信息控制所述电视机播放所述视频点播节目数据。
4.根据权利要求1所述的系统,其特征在于,
所述云计算平台服务器,还用于如果所述语音命令指示用户进行网络增值业务,启动网络增值业务功能,与所述网络增值业务提供商建立连接,获取该网络增值业务服务。
5.根据权利要求1-4中任意一项所述的系统,其特征在于,所述遥控装置与所述控制装置通过以下任意一种或组合的通信方式进行通信:WiFi、Wimax、蓝牙、红外或者有线。
6.根据权利要求1-4中任意一项所述的系统,其特征在于,所述控制装置与所述电视机独立设置;或者,所述控制装置嵌入在所述电视机中。
7.根据权利要求6所述的系统,其特征在于,当所述控制装置与所述电视机独立设置时,所述控制装置与所述电视机通过以下任意一种或组合的通信方式进行通信:WiFi、Wimax、蓝牙或者有线。
8.一种语音控制电视机的方法,其特征在于,包括:
在用户按下遥控装置的启动语音录入键以后,所述遥控装置指示控制装置与网络侧的云计算平台服务器建立通信连接;
所述遥控装置接收所述用户发送的语音命令,将该语音命令发送给所述控制装置;
所述控制装置通过与所述云计算平台服务器建立的通信连接将所述语音命令发送给所述云计算平台服务器;
所述云计算平台服务器采用非特定人语音识别技术和预先存储的多种广谱语音特征库对所述语音命令进行识别、解析,获取所述语音命令对应的电视机控制信息,其中,所述广谱语音特征库是通过采集全中国各地、各种人以及这些人在不同环境、不同噪音背景下的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有语音特征库的信息,而不依赖于特定人的语音特征训练结果;
所述云计算平台服务器将所述电视机控制信息发送给所述控制装置;
所述控制装置根据所述电视机控制信息对所述电视机控制。
9.根据权利要求8所述的方法,其特征在于,还包括:
当用户按下遥控装置的启动语音录入键时,所述遥控装置向所述控制装置发送电视机静音指示;
所述控制装置根据所述电视机静音指示启动所述电视机的静音功能。
10.根据权利要求8所述的方法,其特征在于,还包括:
如果所述语音命令指示所述用户进行视频点播,所述云计算平台服务器从媒体数据库中获取所述语音命令指示的视频点播节目数据,将所述视频点播节目数据发送给所述控制装置;
则所述控制装置根据所述电视机控制信息对所述电视机控制包括:
所述控制装置根据电视机控制信息控制所述电视机播放所述视频点播节目数据。
11.根据权利要求8所述的方法,其特征在于,还包括:
如果所述语音命令指示用户进行网络增值业务,所述云计算平台服务器启动网络增值业务功能,与所述网络增值业务提供商建立连接,获取该网络增值业务服务。
12.一种遥控装置,其特征在于,包括:
启动单元,用于接收用户输入的启动语音录入按键信息;
控制单元,用于在所述启动单元接收到用户输入的启动语音录入按键信息以后,向控制装置发送建立连接控制命令,该建立连接控制命令用于指示所述控制装置与网络侧的云计算平台服务器建立通信连接;
语音录入单元,用于在所述启动单元接收到用户输入的启动语音录入按键信息以后,接收用户发送的语音命令;
发送单元,用于将所述语音录入单元接收的语音命令发送给所述控制装置,以使得控制装置将所述语音命令通过所述通信连接发送给云计算平台服务器后,所述云计算平台服务器通过非特定人语音识别模块和多种广谱语音特征库获取所述语音命令对应的电视机控制信息,使所述控制装置能够根据该语音命令获取云计算平台服务器返回的电视机控制信息,并根据该电视机控制信息对电视机进行控制;
其中,所述广谱语音特征库是通过采集全中国各地、各种人以及这些人在不同环境、不同噪音背景下的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有语音特征库的信息,而不依赖于特定人的语音特征训练结果。
13.根据权利要求12所述的遥控装置,其特征在于,所述控制单元,还用于在所述启动单元接收到用户输入的启动语音录入按键信息以后,向所述控制装置发送电视机静音指示,该电视机静音指示用于指示所述控制装置启动电视机的静音功能。
14.一种控制装置,其特征在于,包括:
第一接收单元,用于接收遥控装置发送的建立连接控制命令;
连接单元,用于根据所述第一接收单元接收的建立连接控制命令与网络侧的云计算平台服务器建立通信连接;
第二接收单元,用于接收所述遥控装置发送的语音命令;
第一发送单元,用于通过所述连接单元建立的通信连接,将所述第二接收单元接收的语音命令发送给所述云计算平台服务器,使所述云计算平台服务器通过非特定人语音识别模块和多种广谱语音特征库获取所述语音命令对应的电视机控制信息,所述广谱语音特征库是通过采集全中国各地、各种人以及这些人在不同环境、不同噪音背景下的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有语音特征库的信息,而不依赖于特定人的语音特征训练结果;
第三接收单元,用于通过所述连接单元建立的通信连接,接收所述云计算平台服务器返回的电视机控制信息;
控制单元,用于根据所述第三接收单元接收的电视机控制信息对所述电视机进行控制。
15.根据权利要求14所述的控制装置,其特征在于,还包括:
第四接收单元,用于通过所述连接单元建立的通信连接,接收所述云计算平台服务器发送的视频点播节目数据;
所述控制单元,还用于根据所述第三接收单元接收的电视机控制信息控制所述电视机播放所述第四接收单元接收的视频点播节目数据。
语音控制电视机的方法、装置和系统\n技术领域\n[0001] 本发明涉及语音服务技术,尤其涉及一种语音控制电视机的方法、装置和系统。\n背景技术\n[0002] 随着科学技术的进步,各类电子产品层出不穷,目前,电视机已经在家庭中全面普及,并且成为人们日常生活中必不可少的休闲娱乐以及信息获取工具。\n[0003] 现有的电视机一般是由用户通过遥控器按键进行控制的,例如:用户通过在遥控器上按下相应的台号控制电视机换台,又如:用户通过按下遥控器上相应的功能键(如声音键)对电视机本身的功能(如音量)进行控制等。\n[0004] 在实现本发明的过程中,发明人发现,通过遥控器按键控制电视机的操作较复杂,用户必须对遥控器按键的各个功能均熟悉才能正确操作,不适合老人、孩子以及视力有缺陷的人群使用。\n发明内容\n[0005] 为解决上述使用的不便,本发明的实施例提供一种语音控制电视机的方法、装置和系统,能够简化用户控制电视机的操作,使用户方便、快捷地对电视机进行控制。\n[0006] 一种语音控制电视机的系统,包括:遥控装置、控制装置和云计算平台服务器;\n[0007] 所述遥控装置,用于在用户按下启动语音录入键以后,指示所述控制装置与云计算平台服务器建立通信连接,接收用户发送的语音命令,将所述语音命令发送给所述控制装置;\n[0008] 所述控制装置,用于与云计算平台服务器建立通信连接,接收所述遥控装置发送的语音命令,将所述语音命令通过所述通信连接发送给云计算平台服务器,接收所述云计算平台服务器返回的电视机控制信息,根据所述电视机控制信息对电视机进行控制;\n[0009] 所述云计算平台服务器,位于网络侧,包括非特定人语音识别模块,所述云计算平台服务器用于接收所述控制装置发送的语音命令,通过所述非特定人语音识别模块对所述语音命令进行识别、解析,获取所述语音命令对应的电视机控制信息,将所述电视机控制信息发送给所述控制装置。\n[0010] 一种语音控制电视机的方法,包括:在用户按下遥控装置的启动语音录入键以后,所述遥控装置指示控制装置与网络侧的云计算平台服务器建立通信连接;所述遥控装置接收所述用户发送的语音命令,将该语音命令发送给所述控制装置;所述控制装置通过与所述云计算平台服务器建立的通信连接将所述语音命令发送给所述云计算平台服务器;所述云计算平台服务器采用非特定人语音识别技术对所述语音命令进行识别、解析,获取所述语音命令对应的电视机控制信息;所述云计算平台服务器将所述电视机控制信息发送给所述控制装置;所述控制装置根据所述电视机控制信息对所述电视机控制。\n[0011] 一种遥控装置,包括:\n[0012] 启动单元,用于接收用户输入的启动语音录入按键信息;\n[0013] 控制单元,用于在所述启动单元接收到用户输入的启动语音录入按键信息以后,向控制装置发送建立连接控制命令,该建立连接控制命令用于指示所述控制装置与网络侧的云计算平台服务器建立通信连接;\n[0014] 语音录入单元,用于在所述启动单元接收到用户输入的启动语音录入按键信息以后,接收用户发送的语音命令;\n[0015] 发送单元,用于将所述语音录入单元接收的语音命令发送给所述控制装置,以使得控制装置能够根据该语音命令获取云计算平台服务器返回的电视机控制信息,并根据该电视机控制信息对电视机进行控制。\n[0016] 一种控制装置,包括:\n[0017] 第一接收单元,用于接收遥控装置发送的建立连接控制命令;\n[0018] 连接单元,用于根据所述第一接收单元接收的建立连接控制命令与网络侧的云计算平台服务器建立通信连接;\n[0019] 第二接收单元,用于接收所述遥控装置发送的语音命令;\n[0020] 第一发送单元,用于通过所述连接单元建立的通信连接,将所述第二接收单元接收的语音命令发送给所述云计算平台服务器;\n[0021] 第三接收单元,用于通过所述连接单元建立的通信连接,接收所述云计算平台服务器返回的电视机控制信息;\n[0022] 控制单元,用于根据所述第三接收单元接收的电视机控制信息对所述电视机进行控制。\n[0023] 本发明实施例提供的语音控制电视机的方法、装置和系统,用户只需按下遥控装置上的启动语音录入键即可启动遥控装置的语音录入功能,输入语音命令,并通过控制装置将语音命令传输给网络侧的云计算平台服务器,由该云计算平台服务器对语音命令进行非特定人语音识别、解析,获取相应的电视机控制信息发送给控制装置,由该控制装置对电视机进行控制,解决了现有技术采用按键方式对电视机进行控制,用户操作复杂的问题;本发明实施例提供的技术方案通过语音方式对电视机进行控制,简化了用户控制电视机的操作,提高了用户使用电视机的体验,并且适用性更强,能够满足如老人、孩子以及视力有缺陷的特殊人群使用。并且,由于网络侧的云计算平台服务器能够采用非特定人语音识别技术对语音命令进行识别、解析,使得本发明实施例提供的技术方案的通用性更好,适用于不同语音、音调用户的使用,并且还适用于不同方言的识别,如粤语、闽南语等,同时还适用于主流外语的识别,如英语、法语、德语以及日语等,并且,本发明技术方案还具有自动识别语音命令中的各种不同语言的功能,如当使用者在语音命令中同时使用了中文和英文时,本发明技术方案能够自动识别出该语音命令中的中文和英文,并进行正确解析。上述优点使得本发明实施例提供技术方案进一步提高了用户控制电视机的服务体验,使得不同地区的而用户使用方言即可对电视机进行相关的控制操作,更有利于普通话不标准的用户使用,由于本发明实施例提供的技术方案能够允许用户同时使用多种语言(如中文和英文),更有利于文化层次较高的经常在中文中夹杂外语进行对话的白领阶层用户的使用。并且,由于网络侧的云计算平台服务器能够存储海量语音、语料库以及语音语料模型,使得本发明实施例提供的技术方案语音识别的准确率相较于终端嵌入式语音识别有显著的提高。\n附图说明\n[0024] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。\n[0025] 图1为本发明实施例提供的语音控制电视机的系统结构示意图一;\n[0026] 图2为本发明实施例提供的语音控制电视机的系统结构示意图二;\n[0027] 图3为本发明实施例提供的语音控制电视机的方法流程图;\n[0028] 图4为本发明实施例提供的遥控装置结构示意图;\n[0029] 图5为本发明实施例提供的控制装置结构示意图一;\n[0030] 图6为本发明实施例提供的控制装置结构示意图二。\n具体实施方式\n[0031] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。\n[0032] 为了解决现有技术用户通过遥控装置按键控制电视机的操作复杂的问题,本发明实施例提供一种语音控制电视机的方法、装置和系统。\n[0033] 如图1所示,本发明实施例提供的语音控制电视机的系统,包括:遥控装置101、控制装置102和云计算平台服务器103。\n[0034] 其中,遥控装置101,用于在用户按下启动语音录入键以后,指示控制装置102与云计算平台服务器103建立通信连接,接收用户发送的语音命令,将语音命令发送给控制装置102。\n[0035] 在本实施例中,遥控装置101可以在用户按下启动语音录入键以后,向控制装置\n102发送建立连接控制命令,使控制装置102根据该建立连接控制命令启动建立与云计算平台服务器103之间的通信连接。\n[0036] 在本实施例中,遥控装置101可以通过WiFi、Wimax、蓝牙、红外或者有线等任意一种或组合的方式与控制装置102进行通信。进一步地,当遥控装置101采用红外方式与控制装置102进行通信时,遥控装置101需要将语音命令转换成光信号进行发送。\n[0037] 需要说明的是,本发明实施例提供的遥控装置101可以为普通具有按键功能的遥控器,也可以为能够与其他设备进行通信并且具有控制命令产生功能的设备,本发明实施例不对遥控装置101的具体形式进行限定。\n[0038] 控制装置102,用于与云计算平台服务器103建立通信连接,接收遥控装置101发送的语音命令,将语音命令通过已建立的通信连接发送给云计算平台服务器103,接收云计算平台服务器103返回的电视机控制信息,根据电视机控制信息对电视机进行控制。\n[0039] 在本实施例中,控制装置102可以通过如Internet、3G移动网络等多种通信方式与云计算平台服务器103建立通信连接。具体地,控制装置102可以预先存储云计算平台服务器103的网络地址(如统一资源定位符URL)或者呼叫号码,根据网络地址或者呼叫号码通过如Internet、3G移动网络等与云计算平台服务器103建立通信连接。\n[0040] 进一步地,为了使云计算平台服务器103能够同时与多个控制装置102进行通信,分别为每个控制装置102进行服务,每个控制装置102在与云计算平台服务器103建立通信连接时需需要向云计算平台服务器103发送控制装置102的身份标识信息(如设备标识,或者MAC地址,或者网络标识等),在后续控制装置102向云计算平台服务器103发送语音命令时携带自身的身份标识信息,以使得云计算平台服务器103能够根据身份标识信息对每个控制装置102进行区分。\n[0041] 在本实施例中,电视机控制信息可以包括:控制电视机功能的语义信息或者控制电视机功能的编码命令。当电视机控制信息为控制电视机功能的编码命令时,控制装置102可以直接将该编码命令发送给电视机,电视机识别该编码命令,从而实现对电视机的控制;\n当电视机控制信息为控制电视机功能的语义信息时,控制装置102预先存储有语义信息与电视机编码命令的对应关系表,控制装置102可以根据语音信息查找对应的编码命令,并将查找到的编码命令发送给电视机进行识别,从而实现对电视机的控制。\n[0042] 在本实施例中,当遥控装置101采用红外方式与控制装置102进行通信时,控制装置102需要将接收到的光信号转换成语音命令后发送给云计算平台服务器103。\n[0043] 需要说明的是,本发明实施例提供的控制装置102可以为电视机顶盒,也可以为电视机内部的通信控制模块,还可以为任意一种具有通信功能且能够进行信息处理的设备,本发明实施例不对控制装置102的具体形式进行限定。\n[0044] 进一步地,当控制装置102与电视机独立设置时,如控制装置102为机顶盒或者任意一种具有通信功能且能够进行信息处理的设备,控制装置102可以通过以下任意一种或组合的通信方式与电视机进行通信:WiFi、Wimax、蓝牙或者有线等,当然,本发明并不对控制装置102与电视机之间的通信方式进行限定,在实际的使用过程中,控制装置102也可以采用其他能够进行数据传输的通信方式与电视机进行通信,此处不做一一赘述。\n[0045] 云计算平台服务器103,位于网络侧,包括非特定人语音识别模块,云计算平台服务器103用于接收控制装置102发送的语音命令,通过非特定人语音识别模块对语音命令进行识别、解析,获取语音命令对应的电视机控制信息,将电视机控制信息发送给控制装置\n103。\n[0046] 在本实施例中,云计算平台服务器103上预先存储有多种广谱语音特征库,例如:\n按照地名设置的广谱语音特征库,按照音视频名称设置的广谱语音特征库以及按照人名设置的广谱语音特征库等。非特定人语音识别模块具体用于对语音命令进行解析,提取语音特征信息,根据该语音特征信息查找广谱语音特征库,获取与该语音特征信息对应的语义信息的功能。云计算平台服务器103可以直接将非特定人语音识别模块识别、解析出的语音信息通过电视机控制信息发送给控制装置102;进一步地,云计算平台服务器103还可以预先存储语义信息与电视机编码命令的对应关系表,云计算平台服务器103根据非特定人语音识别模块获取的语义信息查找所述语义信息与电视机编码命令的对应关系表,获取对应的电视机编码命令,将该电视机编码命令通过电视机控制信息发送给控制装置102。\n[0047] 需要说明的是,本实施例提供的广谱语音特征库是通过采集全中国各地、各种人以及这些人在不同环境下(不同噪音背景)的声音后,精粹提取出来的广谱语音特征的集合,该广谱语音特征库只依赖于现有“语音特征库”的信息,而不依赖于某个人的语音特征训练结果。其优点在于:(1)该广谱语音特征库的所选样本广泛,包括世界上不同国家的不同地区的人的发音。例如,在中国,选取了全国几乎每个省县镇地区的人的发音,并对全国不同地区的人划分为几大类,如华北地区、东北地区、闽南语地区、粤语地区等,这些不同地区的人所说的普通话带有地方方言,其特征各不相同,将他们分别归类后,将地方方言发音基本相似的地区的人归为一类,这样既考虑了样本的完备性也兼顾了构建数据库产生尽可能少的冗余信息;(2)对不同环境(噪音背景)下的声音或语音命令进行了提取其语音特征信息,如在汽车发动机发动后所产生的语音命令,当汽车窗户打开后产生风燥和胎噪下所产生的语音命令,在旁人突然插话等干扰情况下所产生的语音命令,在发动机关闭后所产生的语音命令等;(3)该广谱语音特征库包括普通话特征库和地方方言特征库,其中地方方言库包括闽南语库、粤语库、上海话库等。\n[0048] 进一步地,该广谱语音特征库还包括外语库,其中该外语库中具有英语库、法语库、德语库、日语库等主流国外语言库。该系统还具有一特征库自动识别模块,其用于对用户所发出的语音命令进行分析辨别该语音命令所对应的特征库,并自动选择相对应的特征库。从而使得用户可以混合使用不同国家的语言发出语音命令,这些语言可以不经事先筛选来混合使用,该库特征库自动识别模块会自动识别出该语音命令到底是中文还是外语。\n[0049] 通过将上述所建立的广谱语音特征库设置在上述云计算平台服务器103中的优点在于,降低了对遥控装置101的系统的依赖性,将说话者面前的遥控装置101当作一种声音或语音命令的采集设备,将采集到的声音或语音命令的数据传输到后台服务器群如云计算平台服务器103去识别,这样既可发挥多服务器集群架构下的高性能识别计算,同时也可以使用上述大规模的语音特征库,而不需要终端设备具备语音识别能力。\n[0050] 在本实施例中,通过非特定人语音识别模块可以识别出95%的语音信息,为了保证能够100%识别出用户的语音信息,进一步提高服务体验,可选地,云计算平台服务器\n103还可以包括非特定人语音识别人工坐席模块,该非特定人语音识别人工坐席模块,用于当非特定人语音识别模块无法识别语音命令时,对该语音命令进行识别,获取对应的语义信息。\n[0051] 进一步地,为了避免电视机本身发出的声音对用户通过遥控装置101输入的语音命令产生的干扰,本发明实施例提供的语音控制电视机的系统中,遥控装置101还可以用于在用户按下启动语音录入键的同时,向控制装置102发送电视机静音指示;控制装置102还可以用于接收电视机静音指示,根据该电视机静音指示启动电视机的静音功能。\n[0052] 在本实施例中,用户输入的语音命令可以为任意控制命令,例如:语音命令可以为用户对电视机本身功能的语音控制命令(如调整声音大小、调整屏幕的色彩亮度或者开关机指示等);也可以为用户对电视机播放的节目进行控制的命令(如点播需要观看的节目,或者更换频道等)。\n[0053] 为了能够充分满足用户视频点播业务需求,进一步地,如图2所示,本发明实施例提供的语音控制电视机的系统还可以包括:\n[0054] 媒体数据库104,用于存储媒体数据;\n[0055] 则,云计算平台服务器103,还可以用于如果语音命令指示用户进行视频点播,从媒体数据库104中获取语音命令指示的视频点播节目数据,将视频点播节目数据发送给控制装置102;\n[0056] 则,控制装置102,还可以用于接收视频点播节目数据,根据电视机控制信息控制电视机播放视频点播节目数据。\n[0057] 需要说明的是,当用户进行视频点播时,用户输入的语音命令需要包括其所点播的视频节目的相关信息(包括:节目名称、语言种类、演员以及节目类型等中的任意一种或者两种以上组合)。\n[0058] 进一步地,在本实施例中,媒体数据库104可以支持媒体数据上传以及下载功能,用户可以通过控制装置102将本地存储的视频资源发送到云计算平台服务器103,由云计算平台服务器103上传到数据库104中,用户可以将媒体数据库104中存储的视频数据通过云计算平台服务器103和控制装置102下载到本地的存储装置中(例如:如果电视机内部具有数据存储单元,可以将下载的视频数据存储到该数据存储单元中;或者,将下载的数据存储到如U盘等外部存储设备中)。\n[0059] 需要说明的是,当用户需要进行视频数据的上传或者下载等业务时,为了保证合法用户的利益,用户需要通过语音命令向云计算平台服务器103提供相应的帐号和密码等信息。\n[0060] 进一步地,本发明实施例提供的语音控制电视机的系统还可以为用户提供网络增值业务功能,此时,云计算平台服务器103,还可以用于如果语音命令指示用户进行网络增值业务,启动网络增值业务功能,与网络增值业务提供商建立连接,获取该网络增值业务服务。\n[0061] 在本实施例中,网络增值业务可以包括:网页浏览、在线购物、歌曲点播、语音微博、与好友进行网络通信等。\n[0062] 具体地,当云计算平台服务器103启动了网络增值业务功能并与网络增值业务提供商建立连接以后,用户可以进一步通过遥控装置102输入相关的语音控制命令(如所需点播的歌曲名称以及歌手信息,或者所需通信的好友电话号码,或者所需浏览的网页名称等),遥控装置102将所述语音控制命令发送给云计算平台服务器103,由该云计算平台服务器103的非特定人语音识别模块进行识别、解析,并根据解析出的控制信息从网络增值业务提供商获取网络增值业务数据,将该网络增值业务数据发送给遥控装置102,遥控装置\n102在电视机上播放或者显示所述网络增值业务数据。\n[0063] 本发明实施例提供的语音控制电视机的系统,用户只需按下遥控装置上的启动语音录入键即可启动遥控装置的语音录入功能,输入语音命令,并通过控制装置将语音命令传输给网络侧的云计算平台服务器,由该云计算平台服务器对语音命令进行非特定人语音识别、解析,获取相应的电视机控制信息发送给控制装置,由该控制装置对电视机进行控制,解决了现有技术采用按键方式对电视机进行控制,用户操作复杂的问题;本发明实施例提供的技术方案通过语音方式对电视机进行控制,简化了用户控制电视机的操作,提高了用户使用电视机的体验,并且适用性更强,能够满足如老人、孩子以及视力有缺陷的特殊人群使用。并且,由于网络侧的云计算平台服务器能够采用非特定人语音识别技术对语音命令进行识别、解析,使得本发明实施例提供的技术方案的通用性更好,适用于不同语音、音调用户的使用,并且还适用于不同方言的识别,如粤语、闽南语等,同时还适用于主流外语的识别,如英语、法语、德语以及日语等,并且,本发明技术方案还具有自动识别语音命令中的各种不同语言的功能,如当使用者在语音命令中同时使用了中文和英文时,本发明技术方案能够自动识别出该语音命令中的中文和英文,并进行正确解析。上述优点使得本发明实施例提供技术方案进一步提高了用户控制电视机的服务体验,使得不同地区的而用户使用方言即可对电视机进行相关的控制操作,更有利于普通话不标准的用户使用,由于本发明实施例提供的技术方案能够允许用户同时使用多种语言(如中文和英文),更有利于文化层次较高的经常在中文中夹杂外语进行对话的白领阶层用户的使用。并且,由于网络侧的云计算平台服务器能够存储海量语音、语料库以及语音语料模型,使得本发明实施例提供的技术方案语音识别的准确率相较于终端嵌入式语音识别有显著的提高。\n[0064] 如图3所示,本发明实施例还提供一种语音控制电视机的方法,包括:\n[0065] 步骤301,在用户按下遥控装置的启动语音录入键以后,遥控装置指示控制装置与网络侧的云计算平台服务器建立通信连接。\n[0066] 其中,遥控装置可以通过WiFi、Wimax、蓝牙、红外或者有线等任意一种或组合的方式与控制装置进行通信。\n[0067] 其中,控制装置可以通过如Internet、3G移动网络等多种通信方式与云计算平台服务器建立通信连接。具体地,控制装置可以预先存储云计算平台服务器的网络地址(如统一资源定位符URL)或者呼叫号码,根据网络地址或者呼叫号码通过如Internet、3G移动网络等与云计算平台服务器建立通信连接。\n[0068] 进一步地,为了使云计算平台服务器能够同时与多个控制装置进行通信,分别为每个控制装置进行服务,在步骤301中控制装置在与云计算平台服务器建立通信连接时,需需要向云计算平台服务器发送控制装置的身份标识信息(如设备标识,或者MAC地址,或者网络标识等),以使得云计算平台服务器可以根据身份标识信息对控制装置进行区分。\n[0069] 步骤302,遥控装置接收用户发送的语音命令,将该语音命令发送给控制装置。\n[0070] 需要说明的是,如果遥控装置与控制装置采用红外方式进行通信,步骤302中遥控装置需要将语音命令转换成光信号后,通过红外方式发送给控制装置。\n[0071] 步骤303,控制装置通过与云计算平台服务器建立的通信连接将语音命令发送给云计算平台服务器。\n[0072] 步骤304,云计算平台服务器采用非特定人语音识别技术对语音命令进行识别、解析,获取语音命令对应的电视机控制信息。\n[0073] 其中,电视机控制信息可以包括:控制电视机功能的语义信息或者控制电视机功能的编码命令。\n[0074] 在本实施例中,云计算平台服务器上预先存储有多种广谱语音特征库,例如:按照地名设置的广谱语音特征库,按照音视频名称设置的广谱语音特征库以及按照人名设置的广谱语音特征库等。步骤304中云计算平台服务器采用非特定人语音识别技术对语音命令进行解析,提取语音特征信息,根据该语音特征信息查找广谱语音特征库,获取与该语音特征信息对应的控制电视机功能的语义信息;进一步地,云计算平台服务器可以预先存储语义信息与电视机编码命令的对应关系表,云计算平台服务器根据获取的语义信息查找所述语义信息与电视机编码命令的对应关系表,获取对应的电视机编码命令。\n[0075] 步骤305,云计算平台服务器将电视机控制信息发送给控制装置。\n[0076] 步骤306,控制装置根据电视机控制信息对电视机控制。\n[0077] 进一步地,为了避免电视机本身发出的声音对用户通过遥控装置输入的语音命令产生的干扰,本发明实施例提供的语音控制电视机的方法在步骤302之前还可以包括:当用户按下遥控装置的启动语音录入键时,遥控装置向控制装置发送电视机静音指示;以及,控制装置根据电视机静音指示启动电视机的静音功能的步骤。\n[0078] 在本实施例中,用户输入的语音命令可以为任意控制命令,例如:语音命令可以为用户对电视机本身功能的语音控制命令(如调整声音大小、调整屏幕的色彩亮度或者开关机指示等);也可以为用户对电视机播放的节目进行控制的命令(如点播需要观看的节目,或者更换频道等)。\n[0079] 为了能够充分满足用户视频点播业务需求,本发明实施例提供的语音控制电视机的方法,还可以包括:如果语音命令指示用户进行视频点播,云计算平台服务器从媒体数据库中获取语音命令指示的视频点播节目数据,将视频点播节目数据发送给所述控制装置的步骤。则此时,步骤306具体可以为控制装置根据电视机控制信息控制电视机播放视频点播节目数据。\n[0080] 需要说明的是,当用户进行视频点播时,用户输入的语音命令需要包括其所点播的视频节目的相关信息(包括:节目名称、语言种类、演员以及节目类型等中的任意一种或者两种以上组合)。\n[0081] 进一步地,本发明实施例提供的语音控制电视机的方法,还可以包括:如果语音命令指示用户进行网络增值业务,云计算平台服务器启动网络增值业务功能,与网络增值业务提供商建立连接,获取该网络增值业务服务的步骤。通过上述步骤,本发明实施例提供的语音控制电视机的方法可以实现为用户提供网络增值业务的功能。其中,网络增值业务可以包括:网页浏览、在线购物、歌曲点播、语音微博、与好友进行网络通信等。\n[0082] 本发明实施例提供的语音控制电视机的方法的具体实现可以参见本发明实施例提供的语音控制电视机的系统所述,此处不再赘述。\n[0083] 本发明实施例提供的语音控制电视机的方法,用户只需按下遥控装置上的启动语音录入键即可启动遥控装置的语音录入功能,输入语音命令,并通过控制装置将语音命令传输给网络侧的云计算平台服务器,由该云计算平台服务器对语音命令进行非特定人语音识别、解析,获取相应的电视机控制信息发送给控制装置,由该控制装置对电视机进行控制,解决了现有技术采用按键方式对电视机进行控制,用户操作复杂的问题;本发明实施例提供的技术方案通过语音方式对电视机进行控制,简化了用户控制电视机的操作,提高了用户使用电视机的体验,并且适用性更强,能够满足如老人、孩子以及视力有缺陷的特殊人群使用。并且,由于网络侧的云计算平台服务器能够采用非特定人语音识别技术对语音命令进行识别、解析,使得本发明实施例提供的技术方案的通用性更好,适用于不同语音、音调用户的使用,并且还适用于不同方言的识别,如粤语、闽南语等,同时还适用于主流外语的识别,如英语、法语、德语以及日语等,并且,本发明技术方案还具有自动识别语音命令中的各种不同语言的功能,如当使用者在语音命令中同时使用了中文和英文时,本发明技术方案能够自动识别出该语音命令中的中文和英文,并进行正确解析。上述优点使得本发明实施例提供技术方案进一步提高了用户控制电视机的服务体验,使得不同地区的而用户使用方言即可对电视机进行相关的控制操作,更有利于普通话不标准的用户使用,由于本发明实施例提供的技术方案能够允许用户同时使用多种语言(如中文和英文),更有利于文化层次较高的经常在中文中夹杂外语进行对话的白领阶层用户的使用。并且,由于网络侧的云计算平台服务器能够存储海量语音、语料库以及语音语料模型,使得本发明实施例提供的技术方案语音识别的准确率相较于终端嵌入式语音识别有显著的提高。\n[0084] 如图4所示,本发明实施例还提供一种遥控装置,包括:\n[0085] 启动单元401,用于接收用户输入的启动语音录入按键信息;\n[0086] 控制单元402,用于在启动单元401接收到用户输入的启动语音录入按键信息以后,向控制装置发送建立连接控制命令,该建立连接控制命令用于指示所述控制装置与网络侧的云计算平台服务器建立通信连接;\n[0087] 语音录入单元403,用于在启动单元401接收到用户输入的启动语音录入按键信息以后,接收用户发送的语音命令;\n[0088] 发送单元404,用于将语音录入单元403接收的语音命令发送给控制装置,以使得控制装置能够根据该语音命令获取云计算平台服务器返回的电视机控制信息,并根据该电视机控制信息对电视机进行控制。\n[0089] 进一步地,为了避免电视机本身发出的声音对用户通过遥控装置输入的语音命令产生的干扰,控制单元402,还可以用于在启动单元401接收到用户输入的启动语音录入按键信息以后,向控制装置发送电视机静音指示,该电视机静音指示用于指示控制装置启动电视机的静音功能。\n[0090] 本发明实施例提供的遥控装置的具体实现可以参见本发明实施例提供的语音控制电视机的系统所述,此处不再赘述。\n[0091] 本发明实施例提供的遥控装置,能够在用户输入启动语音录入按键信息以后,启动语音录入功能,获取用户的语音命令,并将该语音命令发送给控制装置,使得控制装置能够根据该语音命令获取云计算平台服务器返回的电视机控制信息,并根据该电视机控制信息对电视机进行控制,解决了现有技术采用按键方式对电视机进行控制,用户操作复杂的问题;本发明实施例提供的技术方案通过语音方式对电视机进行控制,简化了用户控制电视机的操作,提高了用户使用电视机的体验,并且适用性更强,能够满足如老人、孩子以及视力有缺陷的特殊人群使用。并且,由于网络侧的云计算平台服务器能够采用非特定人语音识别技术对语音命令进行识别、解析,使得本发明实施例提供的技术方案的通用性更好,适用于不同语音、音调用户的使用,并且还适用于不同方言的识别,如粤语、闽南语等,同时还适用于主流外语的识别,如英语、法语、德语以及日语等,并且,本发明技术方案还具有自动识别语音命令中的各种不同语言的功能,如当使用者在语音命令中同时使用了中文和英文时,本发明技术方案能够自动识别出该语音命令中的中文和英文,并进行正确解析。上述优点使得本发明实施例提供技术方案进一步提高了用户控制电视机的服务体验,使得不同地区的而用户使用方言即可对电视机进行相关的控制操作,更有利于普通话不标准的用户使用,由于本发明实施例提供的技术方案能够允许用户同时使用多种语言(如中文和英文),更有利于文化层次较高的经常在中文中夹杂外语进行对话的白领阶层用户的使用。并且,由于网络侧的云计算平台服务器能够存储海量语音、语料库以及语音语料模型,使得本发明实施例提供的技术方案语音识别的准确率相较于终端嵌入式语音识别有显著的提高。\n[0092] 如图5所示,本发明实施例还提供一种控制装置,包括:\n[0093] 第一接收单元501,用于接收遥控装置发送的建立连接控制命令;\n[0094] 连接单元502,用于根据第一接收单元501接收的建立连接控制命令与网络侧的云计算平台服务器建立通信连接;\n[0095] 第二接收单元503,用于接收遥控装置发送的语音命令;\n[0096] 第一发送单元504,用于通过连接单元502建立的通信连接,将第二接收单元503接收的语音命令发送给云计算平台服务器;\n[0097] 第三接收单元505,用于通过连接单元502建立的通信连接,接收云计算平台服务器返回的电视机控制信息;\n[0098] 控制单元506,用于根据第三接收单元505接收的电视机控制信息对电视机进行控制。\n[0099] 进一步地,如图6所示,本发明实施例提供的控制装置,还可以包括:\n[0100] 第四接收单元507,用于通过连接单元502建立的通信连接,接收云计算平台服务器发送的视频点播节目数据;\n[0101] 控制单元506,还用于根据第三接收单元505接收的电视机控制信息控制电视机播放第四接收单元507接收的视频点播节目数据。\n[0102] 本发明实施例提供的控制装置的具体实现可以参见本发明实施例提供的语音控制电视机的系统所述,此处不再赘述。\n[0103] 本发明实施例提供的控制装置,接收用户通过遥控器输入的语音命令,并将语音命令发送给网络侧的云计算平台服务器,获取云计算平台服务器根据该语音命令返回的电视机控制信息,根据该电视机控制信息对电视机进行控制,实现了语音控制电视机的功能,解决了现有技术采用按键方式对电视机进行控制,用户操作复杂的问题;本发明实施例提供的技术方案通过语音方式对电视机进行控制,简化了用户控制电视机的操作,提高了用户使用电视机的体验,并且适用性更强,能够满足如老人、孩子以及视力有缺陷的特殊人群使用。并且,由于网络侧的云计算平台服务器能够采用非特定人语音识别技术对语音命令进行识别、解析,使得本发明实施例提供的技术方案的通用性更好,适用于不同语音、音调用户的使用,并且还适用于不同方言的识别,如粤语、闽南语等,同时还适用于主流外语的识别,如英语、法语、德语以及日语等,并且,本发明技术方案还具有自动识别语音命令中的各种不同语言的功能,如当使用者在语音命令中同时使用了中文和英文时,本发明技术方案能够自动识别出该语音命令中的中文和英文,并进行正确解析。上述优点使得本发明实施例提供技术方案进一步提高了用户控制电视机的服务体验,使得不同地区的而用户使用方言即可对电视机进行相关的控制操作,更有利于普通话不标准的用户使用,由于本发明实施例提供的技术方案能够允许用户同时使用多种语言(如中文和英文),更有利于文化层次较高的经常在中文中夹杂外语进行对话的白领阶层用户的使用。并且,由于网络侧的云计算平台服务器能够存储海量语音、语料库以及语音语料模型,使得本发明实施例提供的技术方案语音识别的准确率相较于终端嵌入式语音识别有显著的提高。\n[0104] 本发明实施例提供的语音控制电视机的方法、装置和系统能够应用在智能家电领域中,实现对电视机的语音智能控制。\n[0105] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
法律信息
- 2021-10-01
专利权的转移
登记生效日: 2021.09.17
专利权人由车音智能科技有限公司变更为成都车音智能科技有限公司
地址由518057 广东省深圳市南山区科苑路6号科技园工业大厦东606A变更为610000 四川省成都市双流区西南航空港经济开发区怡心街道华府大道四段777号
- 2019-04-12
专利权人的姓名或者名称、地址的变更
专利权人由深圳市车音网科技有限公司变更为车音智能科技有限公司
地址由518057 广东省深圳市南山区科苑路6号科技园工业大厦东606A变更为518057 广东省深圳市南山区科苑路6号科技园工业大厦东606A
- 2014-06-18
- 2012-05-02
实质审查的生效
IPC(主分类): H04N 5/44
专利申请号: 201110122756.X
申请日: 2011.05.12
- 2012-04-25
专利申请权的转移
登记生效日: 2012.03.20
申请人由深圳市子栋科技有限公司变更为深圳市车音网科技有限公司
地址由518000 广东省深圳市福田区深南西路车公庙工业区天安数码时代大厦914室变更为518057 广东省深圳市南山区科苑路6号科技园工业大厦东606A
- 2011-09-21
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2006-12-27
|
2005-06-25
| | |
2
| |
2009-05-13
|
2008-12-05
| | |
3
| |
2010-12-01
|
2009-06-01
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |