1.一种通过移动通信终端对视频播放装置进行控制的系统,所述系统包括所述移动通信终端,所述视频播放装置,语音识别服务器,其特征在于,
所述移动通信终端和所述语音识别服务器通过网络相互连接;
所述视频播放装置和所述移动通信终端通过网络相互连接;
所述语音识别服务器用于对输入的语音信息进行语音识别;
其中,所述移动通信终端包括语音接收处理模块和与所述语音接收处理模块相互连接的通信模块,所述通信模块与所述语音识别服务器通过网络相互连接,所述通信模块与所述视频播放装置通过网络相互连接;
所述语音接收处理模块用于接收用户输入的所述语音信息和语音模式;
所述语音接收处理模块能够通过所述通信模块接收所述语音识别服务器对所述语音信息的语音识别结果,并对接收的所述语音识别的结果进行逻辑处理;
所述语音模式包括文本输入模式和语音控制模式;
当所述语音模式为所述文本输入模式时,所述视频播放装置将所述逻辑处理的语音识别结果进行显示;
当所述语音模式为所述语音控制模式时,所述视频播放装置将所述逻辑处理的语音识别的结果转化为命令信息,与用于启动应用程序的命令信息库进行匹配,匹配成功后,启动所述命令信息相应的应用程序。
2.一种使用权利要求1中所述的系统的通过移动通信终端对视频播放装置进行控制的方法,其特征在于,包括:
(1)所述移动通信终端的所述语音接收处理模块接收用户输入的所述语音信息和所述语音模式;
(2)所述语音接收处理模块将接收到的所述语音信息和所述语音模式发送给所述通信模块,所述通信模块将接收到的所述语音信息和所述语音模式通过所述网络发送给所述语音识别服务器,所述语音识别服务器对接收到的所述语音信息进行所述语音识别;
(3)所述语音识别服务器将识别结果通过所述网络发送给所述通信模块,所述通信模块将接收到的所述识别结果发送给所述语音接收处理模块,所述语音接收处理模块对接收到的所述识别结果进行逻辑处理;
(4)所述语音接收处理模块将所述逻辑处理后的识别结果发送给所述通信模块,并通过所述通信模块将所述逻辑处理后的识别结果和所述接收到的语音模式通过所述网络发送给所述视频播放装置;
(5)所述视频播放装置根据所述接收到的语音模式,对所述逻辑处理后的识别结果进行相应的处理。
3.一种如权利要求2所述的通过移动通信终端对视频播放装置进行控制的方法,其特征在于,所述识别结果为文字,所述逻辑处理包括将所述文字去掉无用的标点符号。
4.一种如权利要求2所述的通过移动通信终端对视频播放装置进行控制的方法,其特征在于,所述语音模式包括文本输入模式和语音控制模式。
5.一种如权利要求4所述的通过移动通信终端对视频播放装置进行控制的方法,其特征在于,当所述语音模式为所述文本输入模式时,所述视频播放装置将所述逻辑处理的识别结果进行显示。
6.一种如权利要求4所述的通过移动通信终端对视频播放装置进行控制的方法,其特征在于,当所述语音模式为所述语音控制模式时,所述视频播放装置将所述逻辑处理的识别结果转化为命令信息,与用于启动应用程序的命令信息库进行匹配,匹配成功后,启动所述命令信息相应的应用程序。
一种通过移动通信终端对视频播放装置进行语音控制的系\n统及方法\n技术领域\n[0001] 本发明涉及网络通信领域,更具体地说,涉及一种通过移动通信终端对视频播放装置进行语音控制的系统及方法。\n背景技术\n[0002] 随着技术的发展,视频播放装置已经由单独的收看功能发展成多功能的多媒体信息终端,能够和用户进行互动。现有的视频播放装置都可以接入到因特网中,作为因特网中的一个节点,进行收发邮件、浏览网页、参与游戏等。\n[0003] 视频播放装置和用户进行互动就需要接收用户的指令,现有技术中,主要是使用视频播放装置附带的传统的红外遥控器对视频播放装置进行一些简单的控制,对于很多复杂的控制形式,比如文本输入控制、语音输入控制等依然无能为力。\n[0004] 移动通信终端的功能也在日臻完善,从最初的收发短信,接收电话,到现在的收看视频、参与网络中接收邮件和浏览网页、游戏互动、GPS导航等,但是为了方便携带,其显示屏幕受到限制,用户的视觉体验和观看视频的效果还是不如传统的视频播放装置,传统的视频播放装置给用户一种身临其境的感觉。在现实生活中,移动通信终端几乎人手一台,并且对于移动通信终端的输入控制也十分方便。\n[0005] 因此,为了解决传统的红外遥控器功能相对简单,不能满足对视频播放装置复杂的输入控制,需要一种将移动通信终端和视频播放装置进行交互的方法及系统,通过移动通信终端实现例如语音输入等复杂的控制方式,灵活的使用视频播放装置,发挥视频播放装置的最大功能。虽然,目前用户通过移动通信终端的软键盘也能够实现文本输入,进而实现对视频播放装置的控制,但是不如语音控制方式高效,便捷。\n[0006] 同时,移动通信终端还可以替代传统的红外遥控器,不仅实现了传统的红外遥控器的功能,还具有复杂的输入控制功能,不仅方便用户使用,而且能够节约资源。\n发明内容\n[0007] 本发明的目的是提供一种通过移动通信终端对视频播放装置进行控制的系统及方法,解决对视频播放装置进行语音输入控制的问题。使得用户可以通过自己的移动通信终端轻松的实现对视频播放装置的控制,取代传统的红外遥控器。\n[0008] 本发明提供一种通过移动通信终端对视频播放装置进行控制的系统,所述系统包括所述移动通信终端,所述视频播放装置,语音识别服务器,其特征在于:所述移动通信终端和所述语音识别服务器通过网络相互连接;所述视频播放装置和所述移动通信终端通过网络相互连接;所述语音识别服务器用于对输入的语音信息进行语音识别;\n[0009] 其中,所述移动通信终端包括语音接收处理模块和与所述语音接收处理模块相互连接的通信模块,所述通信模块与所述语音识别服务器通过网络相互连接,所述通信模块与所述视频播放装置通过网络相互连接;所述语音接收处理模块用于接收用户输入的所述语音信息和语音模式。\n[0010] 优选的是,所述语音接收处理模块能够通过所述通信模块接收所述语音识别服务器对所述语音信息的语音识别结果,并对接收的所述语音识别的结果进行逻辑处理。\n[0011] 优选的是,所述语音模式包括文本输入模式和语音控制模式。\n[0012] 优选的是,当所述语音模式为所述文本输入模式时,所述视频播放装置将所述逻辑处理的语音识别结果进行显示。\n[0013] 优选的是,当所述语音模式为所述语音控制模式时,所述视频播放装置将所述逻辑处理的语音识别的结果转化为命令信息,与用于启动应用程序的命令信息库进行匹配,匹配成功后,启动所述命令信息相应的应用程序。\n[0014] 本发明还提供一种使用上述系统的通过移动通信终端对视频播放装置进行控制的方法,其特征在于,包括:\n[0015] (1)所述移动通信终端的所述语音接收处理模块接收用户输入的所述语音信息和所述语音模式;\n[0016] (2)所述语音接收处理模块将接收到的所述语音信息和所述语音模式发送给所述通信模块,所述通信模块将接收到的所述语音信息和所述语音模式通过所述网络发送给所述语音识别服务器,所述语音识别服务器对接收到的所述语音信息进行所述语音识别;\n[0017] (3)所述语音识别服务器将识别结果通过所述网络发送给所述通信模块,所述通信模块将接收到的所述识别结果发送给所述语音接收处理模块,所述语音接收处理模块对接收到的所述识别结果进行逻辑处理;\n[0018] (4)所述语音接收处理模块将所述逻辑处理后的识别结果发送给所述通信模块,并通过所述通信模块将所述逻辑处理后的识别结果和所述接收到的语音模式通过所述网络发送给所述视频播放装置;\n[0019] (5)所述视频播放装置根据所述接收到的语音模式,对所述逻辑处理后的识别结果进行相应的处理。\n[0020] 优选的是,所述识别结果为文字,所述逻辑处理包括将所述文字去掉无用的标点符号。\n[0021] 优选的是,所述语音模式包括文本输入模式和语音控制模式。\n[0022] 优选的是,当所述语音模式为所述文本输入模式时,所述视频播放装置将所述逻辑处理的识别结果进行显示。\n[0023] 优选的是,当所述语音模式为所述语音控制模式时,所述视频播放装置将所述逻辑处理的识别结果转化为命令信息,与用于启动应用程序的命令信息库进行匹配,匹配成功后,启动所述命令信息相应的应用程序。\n[0024] 与现有技术相比,本发明的优点在于通过移动通信终端实现语音输入等复杂的控制方式,灵活的使用视频播放装置,发挥视频播放装置的最大功能。\n附图说明\n[0025] 为了使本发明便于理解,现在结合附图描述本发明的具体实施例。\n[0026] 图1为按照本发明的通过移动通信终端对视频播放装置进行控制的系统的一优选实施例的逻辑结构图。\n[0027] 图2为按照本发明的通过移动通信终端对视频播放装置进行控制的方法的一优选实施例的流程图。\n具体实施方式\n[0028] 下面结合附图和具体实施方式对本发明作进一步详细描述。\n[0029] 本发明的目的是提供一种通过移动通信终端对视频播放装置进行控制的系统及方法,解决对视频播放装置进行语音输入控制的问题。\n[0030] 图1为按照本发明的通过移动通信终端对视频播放装置进行控制的系统的一优选实施例的逻辑结构图。图2为按照本发明的通过移动通信终端对视频播放装置进行控制的方法的一优选实施例的流程图。如图所示,移动通信终端的语音接收处理模块接收用户输入的语音信息和语音模式;语音接收处理模块将接收到的语音信息和语音模式发送给通信模块,通信模块将接收到的所述语音信息和所述语音模式通过网络发送给语音识别服务器;语音识别服务器对接收到的语音信息进行语音识别,语音识别服务器将识别后的结果,如文字,通过网络发送给通信模块,通信模块将接收到的识别结果发送给语音接收处理模块;语音接收处理模块对接收到的识别结果进行逻辑处理,语音接收处理模块将逻辑处理后的识别结果发送给通信模块;移动通信终端中的通信模块将逻辑处理后的识别结果和接收到的语音模式通过网络发送给视频播放装置;视频播放装置根据接收到的语音模式,对逻辑处理后的识别结果进行相应的处理;其中,语音模式包括文本输入模式和语音控制模式。当语音模式为文本输入模式时,视频播放装置将逻辑处理的识别结果进行显示;当语音模式为语音控制模式时,视频播放装置将逻辑处理的识别结果转化为命令信息,与用于启动应用程序的命令信息库进行匹配,匹配成功后,启动命令信息相应的应用程序。所述逻辑处理包括将接收到的可识别文字去掉无用的标点符号。\n[0031] 为了实现本发明的目的,本发明提供的一优选实施例如下:\n[0032] 首先,用户的移动通信终端的语音接收处理模块接收来自用户的语音信息和用户的语音模式。其中,所述语音模式包括语音控制模式和文本输入模式。在这一优选实施例中,所述用户的语音模式为文本输入模式。\n[0033] 第二,所述语音接收处理模块将所述语音信息发送给所述通信模块,所述通信模块将接收到的所述语音信息和所述语音模式通过网络发送给语音识别服务器,所述语音识别服务器对接收到的所述语音信息进行语音识别,例如,将所述语音信息转换成文字。例如,用户通过所述语音接收处理模块输入语音“龙门飞甲”,所述语音接收处理模块将所述输入语音“龙门飞甲”发送给所述通信模块,所述通信模块将接收到的所述语音信息和所述语音模式通过网络发送给所述语音识别服务器,所述语音识别服务器进行语音识别处理后,转换成可识别的文字“龙门飞甲”。\n[0034] 第三,所述语音识别服务器将处理后的可识别文字发送给所述用户移动通信终端的所述通信模块,所述通信模块将其发送给所述语音接收处理模块,所述语音接收处理模块接收到识别结果,对接收到的所述识别结果进行逻辑处理。例如,将收到的文字信息去掉无用的标点符号,如“,”或“、”等。\n[0035] 第四,所述移动通信终端中的所述语音接收处理模块将经过逻辑处理的所述识别结果和所述用户的语音模式,即文本输入模式,发送给所述通信模块,所述通信模块通过网络将他们传输到视频播放装置。\n[0036] 第五,所述视频播放装置根据接收到的所述逻辑处理后的识别结果和所述用户的语音模式,进行相应的处理。所述用户的语音模式为文本输入模式,所述视频播放装置将接收到的所述可识别文字显示到文本框中。例如,所述视频播放装置将接收到的文本输入信息“龙门飞甲”显示到相应的文本框中。\n[0037] 本发明提供的又一优选实施例如下:\n[0038] 首先,用户的移动通信终端的语音接收处理模块接收来自用户的语音信息和用户的语音模式。其中,所述语音模式包括语音控制模式和文本输入模式。在这一优选实施例中,所述用户的语音模式为语音控制模式。\n[0039] 第二,所述语音接收处理模块将所述语音信息发送给所述通信模块,所述通信模块将接收到的所述语音信息和所述语音模式通过网络发送给语音识别服务器,所述语音识别服务器对接收到的所述语音信息进行语音识别处理,例如,将所述语音信息转换成文字。\n例如,用户通过所述语音接收处理模块输入语音“打开主页”,所述语音接收处理模块将所述输入语音“打开主页”发送给所述通信模块,所述通信模块将接收到的所述语音信息和所述语音模式通过网络发送给所述语音识别服务器,所述语音识别服务器进行语音识别处理后,转换成可识别的文字“打开主页”。\n[0040] 第三,所述语音识别服务器接处理后的可识别文字发送给所述用户移动通信终端的所述通信模块,所述通信模块将其发送给所述语音接收处理模块,所述语音接收处理模块接收到识别结果,对接收到的所述识别结果进行逻辑处理。例如,将收到的文字信息去掉无用的标点符号,如“,”或“、”等。\n[0041] 第四,所述移动通信终端中的所述语音接收处理模块将经过逻辑处理的所述识别结果和所述用户的语音模式,即语音控制模式,发送给所述通信模块,所述通信模块通过网络将他们传输到视频播放装置。\n[0042] 第五,所述视频播放装置根据接收到的所述逻辑处理后的识别结果和所述用户的语音模式,进行相应的处理。如果所述用户的语音模式为语音控制模式,那么所述视频播放装置将接收到的所述可识别文字转为命令信息,与用于启动应用程序的命令信息库进行匹配,匹配成功后,启动所述命令信息相应的应用程序。例如,所述视频播放装置将接收到的命令信息“打开主页”与用于启动应用程序的命令信息库进行匹配,匹配成功后,启动“打开主页”相应的应用程序,即启动相应的主页浏览程序。\n[0043] 所述命令信息库与语音命令的匹配方式可以是系统默认设置的匹配方式,也可以提供操作界面,供用户自定义语音命令与命令信息库的匹配关系。用户可通过文本输入模式自定义语音命令与命令信息库的对应关系。\n[0044] 上述详细描述通过实施例和/或示意图阐明了系统和/或过程的各种实施例。就这些示意图和/或包含一个或多个功能和/或操作而言,本领域技术人员将理解,这些示意图或实施例中的每一个功能和/或操作都可由各种各样的硬件、软件、固件、或实际上其任意组合来单独地和/或共同地实现。\n[0045] 应该理解,本文描述的方法可以结合硬件或软件,或在适当时结合两者的组合来实现。因此,本发明的方法,可以采用包含在诸如软盘、CD-ROM、硬盘驱动器或任何其他机器可读存储介质等有形介质中的程序代码(即,指令)的形式,其中,当程序代码在可编程计算机上执行的情况下,计算设备通常包括处理器、该处理器可读的存储介质(包括易失性存储器和/或存储元件)、至少一个输入设备、以及至少一个输出设备。一个或多个程序可以例如,通过使用API,可重用控件等来实现或利用结合本发明描述的过程。这样的程序优选地用高级过程语言或面向对象编程语言来实现,以与计算机系统通信。然而,如果需要,该程序可以用汇编语言或机器语言来实现。在任何情形中,语言可以是编译语言或解释语言,且与硬件实现相结合。\n[0046] 需要说明的是,本发明的通过移动通信终端对视频播放装置进行控制的系统及方法的技术方案的范畴包括上述各部分之间的任意组合。\n[0047] 尽管具体地参考其优选实施例来示出并描述了本发明,但本领域的技术人员可以理解,可以作出形式和细节上的各种改变而不脱离所附权利要求书中所述的本发明的范围。以上结合本发明的具体实施例做了详细描述,但并非是对本发明的限制。凡是依据本发明的技术实质对以上实施例所做的任何简单修改,均仍属于本发明技术方案的范围。
法律信息
- 2018-05-29
未缴年费专利权终止
IPC(主分类): H04N 21/422
专利号: ZL 201210136934.9
申请日: 2012.05.07
授权公告日: 2015.01.14
- 2015-01-14
- 2013-06-05
专利申请权的转移
登记生效日: 2013.05.07
申请人由乐视网信息技术(北京)股份有限公司变更为乐视致新电子科技(天津)有限公司
地址由100026 北京市朝阳区光华路4号东方梅地亚中心C座8层变更为300467 天津市塘沽区天津生态城动漫中路126号动漫大厦B1区二层201-427
- 2012-11-07
实质审查的生效
IPC(主分类): G10L 15/26
专利申请号: 201210136934.9
申请日: 2012.05.07
- 2012-09-12
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2011-08-17
|
2011-03-31
| | |
2
| |
2011-01-05
|
2010-08-17
| | |
3
| | 暂无 |
2011-07-21
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |