著录项信息
专利名称 | 基于语音命令的视音频播放方法及系统 |
申请号 | CN201010255337.9 | 申请日期 | 2010-08-17 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2011-01-05 | 公开/公告号 | CN101937693A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G11B19/02 | IPC分类号 | G;1;1;B;1;9;/;0;2;;;H;0;4;L;2;9;/;0;8查看分类表>
|
申请人 | 深圳市子栋科技有限公司 | 申请人地址 | 四川省成都市双流区西南航空港经济开发区怡心街道华府大道四段777号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 成都车音智能科技有限公司 | 当前权利人 | 成都车音智能科技有限公司 |
发明人 | 沈嘉鑫;王力劭;许军;庞泽耀 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明实施例公开了一种基于语音命令的视音频播放方法及系统。涉及媒体播放技术领域,只需按动一启动键,用户对所述终端设备的操作均可通过语音命令来完成。用户按下设置在车辆的固定部件上的一键式控制装置的启动键,所述终端设备与VSP服务器建立语音会话连接,系统进入自动应答状态。所述VSP服务器采用非特定人语音识别技术对用户的语音命令进行解析,并将解析结果发送至所述终端设备,由所述终端设备根据所述解析结果启动视音频播放模块,并根据视音频播放地址获取视音频流。主要应用于娱乐设备,尤其应用于车载娱乐设备。
1.一种基于语音命令的视音频播放方法,其特征在于,包括:
在用户按下一键式控制装置的启动键以后,所述一键式控制装置通过直接或短距离通信方式与终端设备建立连接,其中,所述一键式控制装置设置在车辆的固定部件上,所述一键式控制装置通过直接或短距离通信方式驱动所述终端设备与云计算平台服务器建立连接;
所述终端设备通过语音电话交换网络或多种无线数据网络与网络侧的云计算平台服务器建立语音会话连接;
所述云计算平台服务器通过所述语音会话连接向所述终端设备发送第一语音提示信息,所述第一语音提示信息用于指示所述用户输入服务类型;
所述终端设备向所述用户播放所述第一语音提示信息,接收所述用户根据所述第一语音提示信息发送的启动视音频播放服务的语音命令,并将该启动视音频播放服务的语音命令发送给所述云计算平台服务器;
所述云计算平台服务器采用非特定人语音识别技术对所述启动视音频播放服务的语音命令进行解析,获取启动视音频播放服务控制命令,根据该启动视音频播放服务控制命令启动自动视音频播放服务;
所述终端设备接收所述用户发送的目标视音频语音描述信息,并将该目标视音频语音描述信息发送给所述云计算平台服务器;
所述云计算平台服务器采用非特定人语音识别技术对所述目标视音频语音描述信息进行解析,解析出所述目标视音频在所述云计算平台服务器的视音频数据库中的存储关键字,并在视音频数据库中查找所述目标视音频,获取所述目标视音频播放地址,根据该目标视音频播放地址生成第一自动视音频播放控制信息,采用短信下发或建立数据通道的方式将该第一自动视音频播放控制信息发送给所述终端设备;
所述终端设备根据所述第一自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立数据通道连接,从所述视音频播放服务器获取视音频流,采用媒体播放器播放所述视音频流。
2、根据权利要求1所述的基于语音命令的视音频播放方法,其特征在于,如果所述云计算平台服务器在视音频数据库中查找到两个以上目标视音频,从所述两个以上目标视音频中选取优选的目标视音频,获取该优选的目标视音频播放地址生成第一自动视音频播放控制信息,采用短信下发或建立移动数据通道的方式将该第一自动视音频播放控制信息发送给所述终端设备,所述视音频是事先存储在数据库中的视音频文件,或者是实时编码的实时视音频流,亦或是由多个视音频文件按照事先编制规则制定的视音频信息播出列表。
3、根据权利要求2所述的基于语音命令的视音频播放方法,其特征在于,所述方法还包括:
如果所述终端设备从所述视音频播放服务器获取音频流与所述用户待获取的视音频不符,所述终端设备接收所述用户发送的更换视音频的语音控制命令,并将该更换视音频的语音控制命令发送给所述云计算平台服务器;
所述云计算平台服务器采用非特定人语音识别技术对所述更换视音频的语音控制命令进行解析,获取更换视音频的控制指令,根据该更换视音频的控制指令从所述两个以上目标视音频中选取第二目标视音频,获取该第二目标视音频播放地址生成第二自动视音频播放控制信息,采用短信下发或数据通道的方式将该第二自动视音频播放控制信息发送给所述终端设备;
所述终端设备根据所述第二自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立连接,从所述视音频播放服务器获取视音频流,采用媒体播放器播放所述视音频流。
4、根据权利要求1所述的基于语音命令的视音频播放方法,其特征在于,在所述云计算平台服务器通过所述语音会话连接向所述终端设备发送第一语音提示信息之前,所述方法还包括:
所述云计算平台服务器对所述终端设备进行验证;
所述云计算平台服务器通过所述语音会话连接向所述终端设备发送第一语音提示信息为:当所述验证通过时,所述云计算平台服务器通过所述语音会话连接向所述终端设备发送第一语音提示信息。
5、根据权利要求1-4任意一项所述的基于语音命令的视音频播放方法,其特征在于,所述目标视音频语音描述信息包括:包含目标视音频歌手名和歌曲名的语音描述信息、包含目标视音频歌曲名的语音描述信息,或者包含目标视音频部分歌词的语音描述信息。
6、根据权利要求1-4任意一项所述的基于语音命令的视音频播放方法,其特征在于,所述短距离通信方式为蓝牙、无线数据网络或者红外线。
7、根据权利要求1-4任意一项所述的基于语音命令的视音频播放方法,其特征在于,所述车辆的固定部件为方向盘或前面板任意位置。
8、一种基于语音命令的视音频播放系统,其特征在于,包括:
一键式控制装置,设置在车辆的固定部件上,用于在用户按下启动键以后,通过直接或短距离通信方式与终端设备建立连接,并通过直接或短距离通信方式驱动所述终端设备与云计算平台服务器建立连接;
所述终端设备,用于在与所述一键式控制装置建立连接以后,通过语音电话交换网络或多种无线数据网络与网络侧的云计算平台服务器建立语音会话连接;接收所述云计算平台服务器发送的第一语音提示信息,向用户播放该第一语音提示信息,接收所述用户根据所述第一语音提示信息发送的启动视音频播放服务的语音命令,并将该启动视音频播放服务的语音命令发送给所述云计算平台服务器;接收所述用户发送的目标视音频语音描述信息,并将该目标视音频语音描述信息发送给所述云计算平台服务器;接收所述云计算平台服务器发送的第一自动视音频播放控制信息,根据该第一自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立连接,从所述视音频播放服务器获取视音频流,采用媒体播放器播放所述视音频流;
所述云计算平台服务器,用于通过语音电话交换网络或多种无线数据网络与所述终端设备建立语音会话连接,通过所述语音会话连接向所述终端设备发送第一语音提示信息,所述第一语音提示信息用于指示所述用户输入服务类型;接收所述终端设备发送的启动视音频播放服务的语音命令,采用非特定人语音识别技术对所述启动视音频播放服务的语音命令进行解析,获取启动视音频播放服务控制命令,根据该启动视音频播放服务控制命令启动自动视音频播放服务;接收所述终端设备发送的目标视音频语音描述信息,采用非特定人语音识别技术对所述目标视音频语音描述信息进行解析,解析出所述目标视音频在所述云计算平台服务器的视音频数据库中的存储关键字,并在视音频数据库中查找所述目标视音频,获取所述目标视音频播放地址,根据该目标视音频播放地址生成第一自动视音频播放控制信息,采用短信下发或建立移动数据通道的方式将该第一自动视音频播放控制信息发送给所述终端设备。
9、根据权利要求8所述的基于语音命令的视音频播放系统,其特征在于,所述云计算平台服务器,具体用于如果在视音频数据库中查找到两个以上目标视音频,从所述两个以上目标视音频中选取优选的目标视音频,获取该优选的目标视音频播放地址生成第一自动视音频播放控制信息,采用短信下发或建立移动数据通道的方式将该第一自动视音频播放控制信息发送给所述终端设备。
10、根据权利要求9所述的基于语音命令的视音频播放系统,其特征在于,所述终端设备,还用于接收所述用户发送的更换视音频的语音控制命令,并将该更换视音频的语音控制命令发送给所述云计算平台服务器,接收所述云计算平台服务器发送的第二自动视音频播放控制信息,根据所述第二自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立连接,从所述视音频播放服务器获取视音频流,采用媒体播放器播放所述视音频流;
所述云计算平台服务器,还用于采用非特定人语音识别技术对所述更换视音频的语音控制命令进行解析,获取更换视音频的控制指令,根据该更换视音频的控制指令从所述两个以上目标视音频中选取第二目标视音频,获取该第二目标视音频播放地址生成第二自动视音频播放控制信息,采用短信下发或建立移动数据通道的方式将该第二自动视音频播放控制信息发送给所述终端设备。
11、根据权利要求8所述的基于语音命令的视音频播放系统,其特征在于,所述云计算平台服务器,还用于对所述终端设备进行验证。
12、根据权利要求8-11任意一项所述的基于语音命令的视音频播放系统,其特征在于,所述终端设备为:手机或掌上电脑。
13、根据权利要求8-11任意一项所述的基于语音命令的视音频播放系统,其特征在于,所述视音频播放模块是集成在手机或PDA中。
14、根据权利要求8-11任意一项所述的基于语音命令的视音频播放系统,其特征在于,所述车辆的固定部件为方向盘或前面板任意位置。
15、根据权利要求8-11任意一项所述的基于语音命令的视音频播放系统,其特征在于,所述短距离通信方式为蓝牙、无线数据网或者红外线。
基于语音命令的视音频播放方法及系统 \n技术领域\n[0001] 本发明涉及媒体播放领域,尤其涉及基于语音命令的视音频播放方法及系统。 背景技术\n[0002] 随着人们生活水平的不断提高,车辆已经成为人们生活中不可或缺的代步工具。\n驾车可以使出行变得更方便。 \n[0003] 在行车驾驶过程中,车载娱乐设备能够播放视音频或者接收电台节目,以消除驾驶人员的疲劳。 \n[0004] 但是,现有技术中的车载音响设备在播放视音频或者广播时,通常需要驾驶员手动进行各种操作,比如更换歌曲光碟或者更换广播频段,都需要驾驶员进行手动操作。这些频繁的手动操作大大提高了驾驶人员的驾车危险性。 \n[0005] 同时,目前的车载设备如收音机是接收固定电台的节目,驾驶人员无法选择收听自己需要或者喜欢的节目,如自己特别钟爱的歌曲、相声、评书、有声小说或者提高英语听力的节目等。并且现在的电台在节目期间会插播大量广告,这些广告会给驾驶人员带来困扰和烦躁,但又无法取消,因而导致驾驶人员对固定电台的节目不再感兴趣,从而希望能够随心所欲地收听自己所喜爱的节目,因此,迫切需要提供一种能够通过语音命令来控制并选择接收自己需要的节目的视音频播放装置和方法。 \n发明内容\n[0006] 本发明的实施例提供一种基于语音命令的视音频播放方法及系统,只需按动一启动键,用户对所述终端设备的操作便均可通过语音命令来完成。 \n[0007] 为达到上述目标,本发明的实施例采用如下技术方案: \n[0008] 一种基于语音命令的视音频播放方法,包括: \n[0009] 在用户按下一键式控制装置的启动键以后,所述一键式控制装置通过直接或短距离通信方式与终端设备建立连接,其中,所述一键式控制装置设置在车辆的固定部件上,所述一键式控制装置通过直接或短距离通信方式驱动所述终端设备与云计算平台服务器建立连接;\n[0010] 所述终端设备通过语音电话交换网络或多种无线数据网络与网络侧的云计算平台服务器建立语音会话连接; \n[0011] 所述云计算平台服务器通过所述语音会话连接向所述终端设备发送第一语音提示信息,所述第一语音提示信息用于指示所述用户输入服务类型; \n[0012] 所述终端设备向所述用户播放所述第一语音提示信息,接收所述用户根据所述第一语音提示信息发送的启动视音频播放服务的语音命令,并将该启动视音频播放服务的语音命令发送给所述云计算平台服务器; \n[0013] 所述云计算平台服务器采用非特定人语音识别技术对所述启动视音频播放服务的语音命令进行解析,获取启动视音频播放服务控制命令,根据该启动视音频播放服务控制命令启动自动视音频播放服务; \n[0014] 所述终端设备接收所述用户发送的目标视音频语音描述信息,并将该目标视音频语音描述信息发送给所述云计算平台服务器; \n[0015] 所述云计算平台服务器采用非特定人语音识别技术对所述目标视音频语音描述信息进行解析,解析出所述目标视音频在所述云计算平台服务器的视音频数据库中的存储关键字,并在视音频数据库中查找所述目标视音频,获取所述目标视音频播放地址,根据该目标视音频播放地址生成第一自动视音频播放控制信息,采用短信下发或建立数据通道的方式将该第一自动视音频播放控制信息发送给所述终端设备; \n[0016] 所述终端设备根据所述第一自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立数据通道连接,从所述视音频播放服务器获取视音频流,采用媒体播放器播放所述视音频流。 \n[0017] 一种基于语音命令的视音频播放系统,包括: \n[0018] 一键式控制装置,设置在车辆的固定部件上,用于在用户按下启动键以后,通过直接或短距离通信方式与终端设备建立连接,并通过直接或短距离通信方式驱动所述终端设备与云计算平台服务器建立连接; \n[0019] 所述终端设备,用于在与所述一键式控制装置建立连接以后,通过语音电 话交换网络或多种无线数据网络与网络侧的云计算平台服务器建立语音会话连接;接收所述云计算平台服务器发送的第一语音提示信息,向用户播放该第一语音提示信息,接收所述用户根据所述第一语音提示信息发送的启动视音频播放服务的语音命令,并将该启动视音频播放服务的语音命令发送给所述云计算平台服务器;接收所述用户发送的目标视音频语音描述信息,并将该目标视音频语音描述信息发送给所述云计算平台服务器;接收所述云计算平台服务器发送的第一自动视音频播放控制信息,根据该第一自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立连接,从所述视音频播放服务器获取视音频流,采用媒体播放器播放所述视音频流; \n[0020] 所述云计算平台服务器,用于通过语音电话交换网络或多种无线数据网络与所述终端设备建立语音会话连接,通过所述语音会话连接向所述终端设备发送第一语音提示信息,所述第一语音提示信息用于指示所述用户输入服务类型;接收所述终端设备发送的启动视音频播放服务的语音命令,采用非特定人语音识别技术对所述启动视音频播放服务的语音命令进行解析,获取启动视音频播放服务控制命令,根据该启动视音频播放服务控制命令启动自动视音频播放服务;接收所述终端设备发送的目标视音频语音描述信息,采用非特定人语音识别技术对所述目标视音频语音描述信息进行解析,解析出所述目标视音频在所述云计算平台服务器的视音频数据库中的存储关键字,并在视音频数据库中查找所述目标视音频,获取所述目标视音频播放地址,根据该目标视音频播放地址生成第一自动视音频播放控制信息,采用短信下发或建立移动数据通道的方式将该第一自动视音频播放控制信息发送给所述终端设备。 \n[0021] 本发明实施例提供的基于语音命令的视音频播放方法及系统,用户按下设置在车辆的固定部件上的一键式控制装置的启动键,所述终端设备与VSP服务器建立语音会话连接,系统进入自动应答状态。所述VSP服务器采用非特定人语音识别技术对用户的语音命令进行解析,并将解析结果发送至所述终端设备,由所述终端设备根据所述解析结果启动视音频播放模块,并根据视音频播放地址获取音频流。用户对所述终端设备的操作均可以通过语音命令来完成,不需要手动按键操作输入服务请求,且所述VSP服务器通过非特定人语音识别技术 获取所述语音命令中的服务项目,并执行所述服务项目对应的操作,可以对任意的语音输入进行识别,具有通用性。 \n[0022] 采用本发明实施例提供的基于语音命令的视音频播放方法及系统,驾驶员在行车过程中,只需按动一键,便可以通过语音命令控制实现视音频播放,不需要分散注意力去操作视音频播放设备,降低了驾车过程中的危险性。 \n附图说明\n[0023] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。 \n[0024] 图1为本发明实施例所述基于语音命令的视音频播放方法的流程图; [0025] 图2为本发明实施例所述基于语音命令的视音频播放方法的功能原理图; [0026] 图3为本发明实施例所述基于语音命令的视音频播放方法的优选实施方式的流程图; \n[0027] 图4为本发明实施例所述基于语音命令的视音频播放系统的结构框图; [0028] 图5为本发明实施例所述一键呼出装置参考图。 \n具体实施方式\n[0029] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。 \n[0030] 本发明实施例提供了一种基于语音命令的视音频播放方法,如图1所示,包括: [0031] 101、在用户按下一键式控制装置的启动键以后,所述一键式控制装置通过直接或短距离通信方式与终端设备建立连接。其中,所述一键式控制装置设置在车辆的固定部件上,所述一键式控制装置通过直接或短距离通信方式驱动所述终端设备与VSP服务器建立连接。 \n[0032] 所述一键式控制装置可以设置在车辆中的方向盘上,使驾驶员更方便操作所述一键式控制装置。 \n[0033] 102、所述终端设备通过语音电话交换网络与网络侧的VSP(Voice Spirit Platform,语音精灵云计算平台)服务器建立语音会话连接。 \n[0034] 103、所述VSP服务器通过所述语音会话连接向所述终端设备发送第一语音提示信息,所述第一语音提示信息用于指示所述用户输入服务类型。 \n[0035] 104、所述终端设备向所述用户播放所述第一语音提示信息。 \n[0036] 105、所述终端设备接收所述用户根据所述第一语音提示信息发送的启动视音频播放服务的语音命令。 \n[0037] 106、所述终端设备将该启动视音频播放服务的语音命令发送给所述VSP服务器。 [0038] 107、所述VSP服务器采用非特定人语音识别技术对所述启动视音频播放服务的语音命令进行解析,获取启动视音频播放服务控制命令。 \n[0039] 108、所述VSP服务器根据该启动视音频播放服务控制命令启动自动视音频播放服务。 \n[0040] 109、所述终端设备接收所述用户发送的目标视音频语音描述信息。 [0041] 1010、所述终端设备将该目标视音频语音描述信息发送给所述VSP服务器。 [0042] 1011、所述VSP服务器采用非特定人语音识别技术对所述目标视音频语音描述信息进行解析,解析出所述目标视音频在所述云计算平台服务器的视音频数据库中的存储关键字,并在视音频数据库中查找所述目标视音频,以获取目标视音频播放地址,根据该目标视音频播放地址生成第一自动视音频播放控制信息。 \n[0043] 1012、所述VSP服务器采用短信下发或数据通道的方式将该第一自动视音频播放控制信息发送给所述终端设备。 \n[0044] 1013、所述终端设备根据所述第一自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立连接。 \n[0045] 1014、所述视音频播放服务器根据所述第一自动视音频播放控制信息中包含的目标视音频播放地址向所述终端设备播放视音频流。 \n[0046] 本发明实施例提供的基于语音命令的视音频播放方法,用户按下设置在车辆的固定部件上的一键式控制装置的启动键,所述终端设备与VSP服务器建立语音会话连接,系统进入自动应答状态。所述VSP服务器采用非特定人语音识别技术对用户的语音命令进行解析,并将解析结果发送至所述终端设备,由所述终端设备根据所述解析结果启动视音频播放模块,并根据视音频播放地址获取音频流。用户对所述终端设备的操作均可以通过语音命令来完成,不需要手动按键操作输入服务请求,且所述VSP服务器通过非特定人语音识别技术获取所述语音命令中的服务项目,并执行所述服务项目对应的操作,可以对任意的语音输入进行识别,具有通用性。 \n[0047] 采用本发明实施例提供的基于语音命令的视音频播放方法,驾驶员在行车过程中,只需按动一键,便可以通过语音命令控制实现视音频播放,不需要分散注意力去操作视音频播放设备,降低了驾车过程中的危险性。 \n[0048] 作为本发明实施例的改进,本发明提供了另一种基于语音命令的视音频播放方法,如图2所示,首先,终端设备与VSP服务器建立连接,VSP服务器通过查找数据库,对所述终端设备进行验证,在所述验证通过后,VSP服务器等待用户的语音命令,获取到所述语音命令后,提示用户继续输入表述具体的目标视音频的语音命令,在接收到所述表述具体的目标视音频的语音命令后,从数据库中查找与所述语音命令相匹配的视音频文件,并从找到的视音频文件中选取一个,将播放地址发送给终端设备,所述终端设备为用户播放视音频。此时VSP服务器等待用户切换视音频的命令,如果所播放的视音频不是用户所希望的目标视音频,则用户可以输入重新点歌的语音命令,VSP服务器会根据所述重新点播的命令,重新查找目标视音频,并将播放地址发送至所述终端设备,所述终端设备会根据新的播放地址播放视音频。 \n[0049] 下面对本实施例所述一种基于语音命令的视音频播放方法进行详细的说明。包括: \n[0050] 301、在用户按下一键式控制装置的启动键以后,所述一键式控制装置通过直接或短距离通信方式与终端设备建立连接,直接或通过短距离通信方式驱动所述终端设备与VSP服务器建立连接。 \n[0051] 其中,为了使驾驶员更方便操作所述一键式控制装置,将所述一键式控制装置设置在车辆上的方向盘上。 \n[0052] 作为本实施例的优选的实施方式,所述一键式控制装置也可以设置在方向盘以外的驾驶员方便操作的其他位置。 \n[0053] 302、所述终端设备通过语音电话交换网络与网络侧的VSP服务器建立语音会话连接。 \n[0054] 作为优选的实施方式,所述语音电话交换网络可以是包括移动交换网络和固定电话交换网络的公共电话交换网络,也可以是数据交换网络。 \n[0055] 303、为了提高系统的安全性,所述VSP服务器可以对所述终端设备进行验证。 [0056] 304、当所述验证通过时,所述云计算平台服务器通过所述语音会话连接向所述终端设备发送第一语音提示信息,所述第一语音提示信息用于指示所述用户输入服务类型。 [0057] 具体实施时,所述第一语音提示信息可以视情况任意设定,比如设定为:请输入你所需要的服务类型!或者设定为:请说出您要的服务!等能够提示用户输入的信息。 [0058] 305、所述终端设备向所述用户播放所述第一语音提示信息。 \n[0059] 作为本实施例的优选的实施方式,所述终端设备可以通过语音的方式向所述用户播放所述第一语音提示信息,也可以通过文字信息的方式向所述用户播放所述第一语音提示信息。 \n[0060] 306、所述终端设备接收所述用户根据所述第一语音提示信息发送的启动视音频播放服务的语音命令。 \n[0061] 当用户需要收听视音频的时候,用户可以说出“我要点播”,所述“我要点播”既是启动视音频播放服务的语音命令。 \n[0062] 307、所述终端设备将该启动视音频播放服务的语音命令发送给所述VSP服务器。 [0063] 所述终端设备本身不具有识别所述语音命令“我要点播”的功能,所以需要将启动视音频播放服务的语音命令“我要点播”发送给所述VSP服务器。 \n[0064] 308、所述VSP服务器采用非特定人语音识别技术对所述启动视音频播放服务的语音命令进行解析,获取启动视音频播放服务控制命令。 \n[0065] 所述非特定人语音识别技术所构造的计算机系统,可以对话音进行识别然后获知所述话音的内容,进而根据所述话音的内容发出不同的指令信息,整个过程不需要使用者对系统进行事先训练,系统也不挑剔使用者的发音。而且可以识别多种语言,如英语、中文、日语等。对于不同地区的不同口音也能够作相应的识别。 \n[0066] 所述VSP服务器采用非特定人语音识别技术对语音命令“我要点播”进行解析,获取到所述语音命令“我要点播”需要进行的操作为:启动视音频播放服务控制命令,进入自动视音频播放状态。 \n[0067] 309、所述VSP服务器根据该启动视音频播放服务控制命令启动自动视音频播放服务。 \n[0068] 3010、所述终端设备接收所述用户发送的目标视音频语音描述信息。 [0069] 用户说出“北京欢迎你”,所述终端设备接收所述用户发送的语音命令“北京欢迎你”。 \n[0070] 当然,用户也可以说出某歌手的名称,比如“张三”。所述终端设备接收所述用户根据所述第二语音提示信息发送的语音命令“张三”。 \n[0071] 3011、所述终端设备将该目标视音频语音描述信息发送给所述VSP服务器。 [0072] 所述终端设备将语音命令“北京欢迎你”或者“张三”发送给所述VSP服务器。 [0073] 3012、所述VSP服务器采用非特定人语音识别技术对所述目标视音频语音描述信息进行解析,解析出所述目标视音频在所述VSP服务器的视音频数据库中的存储关键字,并在视音频数据库中查找所述目标视音频,以获取目标视音频播放地址,根据该目标视音频播放地址生成第一自动视音频播放控制信息。 \n[0074] 如果所述VSP服务器在视音频数据库中查找到两个以上目标视音频,从所述两个以上目标视音频中选取优选的目标视音频,获取该优选的目标视音频播放地址生成第一自动视音频播放控制信息。 \n[0075] 当用户输入“张三”时,所述VSP服务器采用非特定人语音识别技术对语 音命令“张三”进行解析,解析出所述“张三”在视音频数据库中的存储关键字为:“张三”,且所述“张三”为一歌手名,则所述VSP服务器在视音频数据库中查找歌手“张三”对应的所有歌曲名称,并通过所述语音会话连接向所述终端设备发送第三语音提示信息,用于提示用户输入包含歌曲名称的语音命令。 \n[0076] 在接收到终端设备发送来的用户输入的包含歌曲名称的语音命令“北京欢迎你”后,所述VSP服务器采用非特定人语音识别技术对语音命令“北京欢迎你”进行解析,解析出所述目标视音频在视音频数据库中的存储关键字为:“北京欢迎你”,并在视音频数据库中查找歌曲“北京欢迎你”,以获取歌曲“北京欢迎你”的播放地址,根据歌曲“北京欢迎你”的播放地址生成自动视音频播放控制信息。 \n[0077] 如果所述视音频数据库中存储两个或者两个以上名称为“北京欢迎你”的视音频文件,则所述VSP服务器从所有名称为“北京欢迎你”的视音频文件中随即选取其中一个进行解析,获取被选取的视音频文件的播放地址,并生成第一自动视音频播放控制信息。 [0078] 所述自动视音频播放控制信息用于控制所述终端设备启动自动播放歌曲“北京欢迎你”。 \n[0079] 如果用户说出的指令为某个实时播放的电台如“欢乐调频”或虚拟播放列表如“金曲排行”等已经事先存储在VSP上的实时播放列表,则所述VSP可以通过短信下发或建立数据通道方式下发指令,驱动终端设备的媒体播放器获取实时视音频流信息进行播放。 [0080] 3013、所述VSP服务器采用短信下发或建立移动数据通道的方式将该第一自动视音频播放控制信息发送给所述终端设备。 \n[0081] 3014、所述终端设备根据接收到的所述第一自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立连接。 \n[0082] 3015、所述视音频播放服务器根据所述第一自动视音频播放控制信息中包含的目标视音频播放地址向所述终端设备播放音频流。 \n[0083] 3016、如果所述终端设备从所述视音频播放服务器获取音频流与所述用户待获取的视音频不符,所述终端设备接收所述用户发送的更换视音频的语音控 制命令。 [0084] 当所述终端设备播放的“北京欢迎你”为歌手A所演唱,但是,用户希望收听的却是歌手B演唱的“北京欢迎你”时,用户可以通过语音命令更换视音频。所述更换视音频的语音控制命令可以根据需要任意设定,不如可以设置为:重新选择、或者我要切换、或者更换歌曲等。 \n[0085] 3017、并将该更换视音频的语音控制命令发送给所述VSP服务器。 \n[0086] 3018、所述VSP服务器采用非特定人语音识别技术对所述更换视音频的语音控制命令进行解析,识别所述更换视音频的控制指令,并获取所述更换视音频的控制指令需要进行的操作。 \n[0087] 3019、所述VSP服务器根据该更换视音频的控制指令从所述两个以上目标视音频中选取第二目标视音频,获取该第二目标视音频播放地址生成第二自动视音频播放控制信息。 \n[0088] 所述VSP服务器从未被选择的名称为“北京欢迎你”的歌曲中选择一个,并对所选择的新的名称为“北京欢迎你”的歌曲进行解析,获取所述新的名称为“北京欢迎你”的歌曲的播放地址,并生成控制终端设备自动播放的第二自动视音频播放控制信息。 [0089] 3020、所述VSP服务器采用短信下发或建立移动数据通道的方式将该第二自动视音频播放控制信息发送给所述终端设备。 \n[0090] 3021、所述终端设备根据所述第二自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立连接。 \n[0091] 3022、所述终端设备从所述视音频播放服务器获取音频流,采用媒体播放器播放所述音频流。 \n[0092] 终端设备接收歌曲“北京欢迎你”的音频流,并采用媒体播放器进行播放。 [0093] 本发明实施例提供的基于语音命令的视音频播放方法,用户按下设置在车辆的固定部件上的一键式控制装置的启动键,所述终端设备与VSP服务器建立语音会话连接,系统进入自动应答状态。所述VSP服务器采用非特定人语音识别技术对用户的语音命令进行解析,并将解析结果发送至所述终端设备,由所述终端设备根据所述解析结果启动视音频播放模块,并根据视音频播放地址获 取音频流。用户对所述终端设备的操作均可以通过语音命令来完成,不需要手动按键操作输入服务请求,且所述VSP服务器通过非特定人语音识别技术获取所述语音命令中的服务项目,并执行所述服务项目对应的操作,可以对任意的语音输入进行识别,具有通用性。 \n[0094] 采用本发明实施例提供的基于语音命令的视音频播放方法及系统,驾驶员在行车过程中,只需按动一键,便可以通过语音命令控制实现视音频播放,不需要分散注意力去操作视音频播放设备,降低了驾车过程中的危险性。 \n[0095] 作为本实施例的另一种优选的实施方式,所述一键控制装置可以为如图4所示的结构或者样式,也可以是与图4所示一键控制装置相类似的结构或者样式。 \n[0096] 作为本实施例的优选的实施方式,所述一键控制装置向所述终端设备发送链接信号可以采用无线通信的方式,比如可以采用蓝牙信号或者Wi-Fi信号的方式向终端设备发送信号。 \n[0097] 作为本实施例的优选的实施方式,所述目标视音频语音描述信息包括:包含目标视音频歌手名和歌曲名的语音描述信息、包含目标视音频歌曲名的语音描述信息,或者包含目标视音频部分歌词的语音描述信息。 \n[0098] 本发明实施例提供了一种基于语音命令的视音频播放系统,如图5所示,包括:一键式控制装置51、终端设备52、VSP服务器53、语音电话交换网络或无线数据交换网络54。 [0099] 其中,在用户按下设置在车辆的固定部件上的一键式控制装置51的启动键以后,所述一键式控制装置51通过直接或短距离通信方式与终端设备52建立连接,并通过直接或通过短距离通信方式驱动所述终端设备与VSP服务器建立连接。 \n[0100] 所述终端设备52自动通过语音电话交换网络54与网络侧的VSP服务器53建立语音会话连接。 \n[0101] 建立所述语音会话连接后,所述VSP服务器33通过所述语音会话连接向所述终端设备52发送用于指示所述用户输入服务类型的第一语音提示信息。 \n[0102] 所述终端设备52向所述用户播放所述第一语音提示信息,在用户根据所述 第一语音提示信息发送启动视音频播放服务的语音命令后,接收所述用户根据所述第一语音提示信息发送的启动视音频播放服务的语音命令,并将该启动视音频播放服务的语音命令发送给所述VSP服务器53。 \n[0103] 所述VSP服务器53采用非特定人语音识别技术对接收到的所述启动视音频播放服务的语音命令进行解析,以获取启动视音频播放服务控制命令,并根据该启动视音频播放服务控制命令启动自动视音频播放服务。 \n[0104] 所述终端设备52接收所述用户发送的目标视音频语音描述信息,并将该目标视音频语音描述信息发送给所述VSP服务器53。 \n[0105] 所述VSP服务器53采用非特定人语音识别技术对所述目标视音频语音描述信息进行解析,解析出所述目标视音频在所述VSP服务器53的视音频数据库中的存储关键字,并在视音频数据库中查找所述目标视音频,获取所述目标视音频播放地址,根据该目标视音频播放地址生成第一自动视音频播放控制信息,采用短信下发或建立移动数据通道的方式将该第一自动视音频播放控制信息发送给所述终端设备52。 \n[0106] 所述终端设备52根据所述第一自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立连接,从所述视音频播放服务器获取视音频流,采用媒体播放器播放所述视音频流。 \n[0107] 本发明实施例提供的基于语音命令的视音频播放方法,用户按下设置在车辆的固定部件上的一键式控制装置的启动键,所述终端设备与VSP服务器建立语音会话连接,系统进入自动应答状态。所述VSP服务器采用非特定人语音识别技术对用户的语音命令进行解析,并将解析结果发送至所述终端设备,由所述终端设备根据所述解析结果启动视音频播放模块,并根据视音频播放地址获取音频流。用户对所述终端设备的操作均可以通过语音命令来完成,不需要手动按键操作输入服务请求,且所述VSP服务器通过非特定人语音识别技术获取所述语音命令中的服务项目,并执行所述服务项目对应的操作,可以对任意的语音输入进行识别,具有通用性。 \n[0108] 采用本发明实施例提供的基于语音命令的视音频播放方法,驾驶员在行车过程中,只需按动一键,便可以通过语音命令控制实现视音频播放,不需要分 散注意力去操作视音频播放设备,降低了驾车过程中的危险性。 \n[0109] 本发明实施例提供一种本实施例所述基于语音命令的视音频播放系统的优选的实施方式: \n[0110] 其中,在用户按下设置在车辆的固定部件上的一键式控制装置51的启动键以后,所述一键式控制装置51通过短距离通信方式与终端设备52建立连接。所述终端设备52通过语音电话交换网络54与网络侧的VSP服务器53建立语音会话连接。 \n[0111] 所述VSP服务器53对所述终端设备52进行验证,当所述验证通过时,所述VSP服务器53通过所述语音会话连接向所述终端设备52发送第一语音提示信息,所述第一语音提示信息用于指示所述用户输入服务类型。 \n[0112] 所述终端设备52向所述用户播放所述第一语音提示信息。接收所述用户根据所述第一语音提示信息发送的启动视音频播放服务的语音命令并将该启动视音频播放服务的语音命令发送给所述VSP服务器53。 \n[0113] 所述VSP服务器53采用非特定人语音识别技术对所述启动视音频播放服务的语音命令进行解析,获取启动视音频播放服务控制命令。根据该启动视音频播放服务控制命令启动自动视音频播放服务。 \n[0114] 所述终端设备52接收所述用户发送的目标视音频语音描述信息,并将该目标视音频语音描述信息发送给所述VSP服务器53。 \n[0115] 所述VSP服务器53采用非特定人语音识别技术对所述目标视音频语音描述信息进行解析,解析出所述目标视音频在所述VSP服务器53的视音频数据库中的存储关键字,并在视音频数据库中查找所述目标视音频,以获取目标视音频播放地址,根据该目标视音频播放地址生成第一自动视音频播放控制信息。如果所述VSP服务器33在视音频数据库中查找到两个以上目标视音频,从所述两个以上目标视音频中选取优选的目标视音频,获取该优选的目标视音频播放地址生成第一自动视音频播放控制信息,并采用短信下发或建立移动数据通道的方式将该第一自动视音频播放控制信息发送给所述终端设备32。 [0116] 所述终端设备52根据所述第一自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立连接。 \n[0117] 所述视音频播放服务器根据所述第一自动视音频播放控制信息中包含的目标视音频播放地址向所述终端设备播放音频流。 \n[0118] 如果所述终端设备52从所述视音频播放服务器获取音频流与所述用户待获取的视音频不符,所述终端设备接收所述用户发送的更换视音频的语音控制命令,并将该更换视音频的语音控制命令发送给所述VSP服务器53。 \n[0119] 所述VSP服务器53采用非特定人语音识别技术对所述更换视音频的语音控制命令进行解析,获取更换视音频的控制指令,并根据该更换视音频的控制指令从所述两个以上目标视音频中选取第二目标视音频,获取该第二目标视音频播放地址生成第二自动视音频播放控制信息。采用短信下发或数据通道的方式将该第二自动视音频播放控制信息发送给所述终端设备52。 \n[0120] 所述终端设备52根据所述第二自动视音频播放控制信息启动视音频播放模块,与视音频播放服务器建立连接,从所述视音频播放服务器获取音频流,采用媒体播放器播放所述音频流。 \n[0121] 本发明实施例提供的基于语音命令的视音频播放方法,用户按下设置在车辆的固定部件上的一键式控制装置的启动键,所述终端设备与VSP服务器建立语音会话连接,系统进入自动应答状态。所述VSP服务器采用非特定人语音识别技术对用户的语音命令进行解析,并将解析结果发送至所述终端设备,由所述终端设备根据所述解析结果启动视音频播放模块,并根据视音频播放地址获取音频流。用户对所述终端设备的操作均可以通过语音命令来完成,不需要手动按键操作输入服务请求,且所述VSP服务器通过非特定人语音识别技术获取所述语音命令中的服务项目,并执行所述服务项目对应的操作,可以对任意的语音输入进行识别,具有通用性。 \n[0122] 采用本发明实施例提供的基于语音命令的视音频播放方法及系统,驾驶员在行车过程中,只需按动一键,便可以通过语音命令控制实现视音频播放,不需要分散注意力去操作视音频播放设备,降低了驾车过程中的危险性。 \n[0123] 作为本实施例的优选的实施方式,为了方便驾驶员操作,所述一键式控制装置可以设置在车辆中的方向盘上也可置于前面板任意方便的位置。 \n[0124] 作为本实施例的优选的实施方式,所述终端设备可以是导航仪、手机、PDA 等。 [0125] 作为本实施例的另一种优选的实施方式,所述一键式控制装置可以为如图4所示的结构或者样式,也可以是与图4所示一键式控制装置相类似的结构或者样式。 [0126] 作为本实施例的优选的实施方式,所述一键式控制装置向所述终端设备发送链接信号可以采用无线通信的方式,比如可以采用蓝牙信号、无线网络或者红外线信号的方式向终端设备发送信号。 \n[0127] 本发明实施例所述语音命令,可以预先设置。为了使操作更简单、更人性化,所述语音命令通常设置成同所述语音命令对应的操作相同或者相近的语句。比如,收听视音频的启动命令就可以设置为:“我要点播”、“音频点播”、“点播”等具有相同或者相关表达意思的语句。 \n[0128] 通过以上的实施方式的描述,所属领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在可读取的存储介质中,如计算机的软盘,硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。 \n[0129] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
法律信息
- 2021-10-01
专利权的转移
登记生效日: 2021.09.18
专利权人由车音智能科技有限公司变更为成都车音智能科技有限公司
地址由518057 广东省深圳市南山区科苑路6号科技园工业大厦东606A变更为610000 四川省成都市双流区西南航空港经济开发区怡心街道华府大道四段777号
- 2018-01-16
专利权人的姓名或者名称、地址的变更
专利权人由深圳市车音网科技有限公司变更为车音智能科技有限公司
地址由518057 广东省深圳市南山区科苑路6号科技园工业大厦东606A变更为518057 广东省深圳市南山区科苑路6号科技园工业大厦东606A
- 2012-04-25
专利权的转移
登记生效日: 2012.03.20
专利权人由深圳市子栋科技有限公司变更为深圳市车音网科技有限公司
地址由518000 广东省深圳市福田区深南西路车公庙工业区天安数码时代大厦914室变更为518057 广东省深圳市南山区科苑路6号科技园工业大厦东606A
- 2012-04-04
- 2011-03-02
实质审查的生效
IPC(主分类): G11B 19/02
专利申请号: 201010255337.9
申请日: 2010.08.17
- 2011-01-05
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |