著录项信息
专利名称 | 语音传输控制方法及系统 |
申请号 | CN201510560931.1 | 申请日期 | 2015-09-06 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2015-12-30 | 公开/公告号 | CN105206273A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G10L15/26 | IPC分类号 | G;1;0;L;1;5;/;2;6;;;G;1;0;L;1;5;/;3;0查看分类表>
|
申请人 | 上海智臻智能网络科技股份有限公司 | 申请人地址 | 上海市嘉定区金沙江西路1555弄398号7层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 上海智臻智能网络科技股份有限公司 | 当前权利人 | 上海智臻智能网络科技股份有限公司 |
发明人 | 李波;陈迪;朱频频 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 张凤伟;吴敏 |
摘要
一种语音传输控制方法及系统。所述方法包括语音应答装置接收语音指令;采用MRCP协议将所述语音指令通过MRCP承载通道发送至声控服务器;所述声控服务器对所述语音指令进行语义识别;基于识别结果生成对应的MRCP控制信息;经所述MRCP承载通道将所述MRCP控制信息发送至所述语音应答装置;所述语音应答装置根据接收到的MRCP控制信息执行相应的操作。应用所述方法可以简化通信系统的系统架构及工作流程,并降低其设计难度。
1.一种语音传输控制方法,其特征在于,包括:
语音应答装置接收语音指令,所述语音应答装置为单独的终端设备或者位于第三方服务系统;
采用MRCP协议将所述语音指令通过MRCP承载通道发送至声控服务器,所述声控服务器以及所述语音应答装置采用MRCP协议并通过MRCP承载通道进行数据传输;
所述声控服务器对所述语音指令进行语义识别;
基于识别结果生成对应的MRCP控制信息;
经所述MRCP承载通道将所述MRCP控制信息发送至所述语音应答装置;
所述语音应答装置根据接收到的MRCP控制信息执行相应的操作;
所述MRCP控制信息为第一MRCP控制信息或第二MRCP控制信息,所述第一MRCP控制信息包括:控制所述语音应答装置播报语音的第一MRCP控制指令,以及所播报的语音对应的数据存储地址;
所述第二MRCP控制信息包括:与所述语音指令对应的应答目标信息,及控制所述语音应答装置执行所述语音指令的第二MRCP控制指令;
所述语音应答装置根据接收到的MRCP控制信息执行相应的操作,包括:所述语音应答装置根据所述第一MRCP控制指令,获取所播报的语音对应的数据并播报语音,提示用户进行输入操作,并将用户输入的语音指令经所述MRCP承载通道发送至所述声控服务器;或所述语音应答装置根据所述第二MRCP控制指令及应答目标信息执行所述语音指令。
2.如权利要求1所述的语音传输控制方法,其特征在于,所述语音应答装置接收到所述第一MRCP控制信息后,还包括:
向语音合成装置发送语音合成请求;
所述语音合成装置根据所述语音合成请求将所述第一MRCP控制信息合成为对应的语音并发送至所述声控服务器。
3.如权利要求1所述的语音传输控制方法,其特征在于,当所述语音应答装置接收到所述语音指令时,还包括:
所述语音应答装置将所述语音指令发送至语音转换装置;
所述语音转换装置将所述语音指令转换为对应的文本数据;
采用MRCP协议将所述语音指令对应的文本数据发送至所述声控服务器。
4.如权利要求1所述的语音传输控制方法,其特征在于,所述应答目标信息为目标号码。
5.如权利要求1所述的语音传输控制方法,其特征在于,所述MRCP承载通道采用会话发起协议SIP作为数据承载协议。
6.如权利要求1所述的语音传输控制方法,其特征在于,所述语音应答装置通过人机交互界面或远程操控的方式接收所述语音指令。
7.如权利要求1所述的语音传输控制方法,其特征在于,
在所述语音应答装置接收语音指令之前,所述方法还包括:
所述语音应答装置接收来自用户的触发操作;
根据所述触发操作向所述声控服务器发送操作请求;
所述声控服务器根据所述操作请求向所述语音应答装置发送对应的MRCP控制信息;
所述语音应答装置接收语音指令,包括:所述语音应答装置根据所述MRCP控制信息接收所述语音指令。
8.一种语音传输控制系统,其特征在于,包括:
语音应答装置,适于接收语音指令;采用MRCP协议将所述语音指令通过MRCP承载通道发送至声控服务器;以及根据接收到的MRCP控制信息执行相应的操作,所述语音应答装置为单独的终端设备或者位于第三方服务系统;
所述声控服务器,适于识别所述语音指令;基于识别结果生成对应的MRCP控制信息;以及经所述MRCP承载通道将所述MRCP控制信息发送至所述语音应答装置;
所述语音应答装置包括:
第一接收单元,适于接收所述语音指令;
第一发送单元,采用MRCP协议将所述语音指令通过MRCP承载通道发送至声控服务器的MRCP服务装置;
操作单元,适于根据接收到的MRCP控制信息执行相应的操作;
所述声控服务器包括:MRCP服务装置及控制装置,其中,
所述控制装置包括:
识别单元,适于对所述语音指令进行语义识别;
生成单元,适于基于识别结果生成对应的MRCP控制信息;
所述MRCP服务装置包括:
第二发送单元,适于经所述MRCP承载通道将所述MRCP控制信息发送至所述语音应答装置;
所述生成单元生成的MRCP控制信息为第一MRCP控制信息或第二MRCP控制信息,所述第一MRCP控制信息包括:控制所述语音应答装置播报语音的第一MRCP控制指令,以及所播报的语音对应的数据存储地址;
所述第二MRCP控制信息包括:与所述语音指令对应的应答目标信息,及控制所述语音应答装置执行所述语音指令的第二MRCP控制指令;
所述操作单元适于根据所述第一MRCP控制指令,获取所播报的语音对应的数据并播报语音,提示用户进行输入操作;
所述第一发送单元还适于将用户输入的语音指令经所述MRCP承载通道发送至所述声控服务器;或
所述操作单元适于根据所述第二MRCP控制指令及应答目标信息执行所述语音指令。
9.如权利要求8所述的语音传输控制系统,其特征在于,所述语音应答装置还适于在接收到所述第一MRCP控制信息后,向语音合成装置发送语音合成请求;
所述系统还包括:语音合成装置,适于根据所述语音合成请求将所述第一MRCP控制信息合成为对应的语音并发送至所述语音应答装置。
10.如权利要求8所述的语音传输控制系统,其特征在于,所述语音应答装置还适于在接收到所述语音指令时,将所述语音应答装置将所述语音指令发送至语音转换装置;
所述系统还包括:语音转换装置,适于将所述语音指令转换为对应的文本数据;以及采用MRCP协议将所述语音指令转换为对应的文本数据发送至所述MRCP服务装置。
11.如权利要求8所述的语音传输控制系统,其特征在于,还包括:语音转换装置,适于将所述语音应答装置接收到的语音指令转换为对应的文本数据;
所述第一发送单元适于将所述语音指令对应的文本数据通过网络数据传输通道发送至所述MRCP服务装置。
12.如权利要求8所述的语音传输控制系统,其特征在于,所述生成单元生成的MRCP控制信息为第二MRCP控制信息,所述第二MRCP控制信息包括:与所述语音指令对应的应答目标信息,及控制所述语音应答装置执行所述语音指令的第二MRCP控制指令;
所述操作单元根据所述第二MRCP控制指令及应答目标信息执行所述语音指令。
13.如权利要求8所述的语音传输控制系统,其特征在于,所述应答目标信息为目标号码。
14.如权利要求8所述的语音传输控制系统,其特征在于,
所述语音应答装置还包括:
第二接收单元,适于在所述语音应答装置接收语音指令之前,接收来自用户的触发操作;
第三发送单元,适于根据所述触发操作向所述声控服务器发送操作请求;
所述声控服务器还包括:
第四发送单元,适于根据所述操作请求向所述语音应答装置发送对应的MRCP控制信息;
所述语音应答装置的第一接收单元适于根据所述MRCP控制信息接收所述语音指令。
15.如权利要求8所述的语音传输控制系统,其特征在于,所述语音应答装置位于第三方服务系统,所述声控服务器集成于人工智能机器人。
语音传输控制方法及系统\n技术领域\n[0001] 本发明涉及语音传输技术领域,特别涉及一种语音传输控制方法及系统。\n背景技术\n[0002] 目前,企业应用系统可以包括企业通信平台及UC系统等。通过企业通信平台及UC系统等系统可以为员工提供便利。例如,企业员工之间可以通过企业通信平台向对方拨打电话,通过UC系统召集多媒体会议等。\n[0003] 在使用企业通信平台或UC系统时,员工需要先查找通讯录来获知目标电话号码,再通过手动按键的方式将所获知的目标电话号码输入至企业通信平台或UC系统来进行相应的通信。\n[0004] 为了使得企业应用系统更加便于使用,目前对企业应用系统进行了改进,使得所述企业应用系统可以基于员工的语音指令执行相应的操作。但是上述改进使得企业应用系统的架构及工作流程变得非常复杂,并且设计难度较大。\n发明内容\n[0005] 本发明要解决的问题是如何简化通信系统的系统架构及工作流程,并降低其设计难度。\n[0006] 本发明实施例提供了一种语音传输控制方法,所述方法包括:\n[0007] 语音应答装置接收语音指令;\n[0008] 采用MRCP协议将所述语音指令通过MRCP承载通道发送至声控服务器;\n[0009] 所述声控服务器对所述语音指令进行语义识别;\n[0010] 基于识别结果生成对应的MRCP控制信息;\n[0011] 经所述MRCP承载通道将所述MRCP控制信息发送至所述语音应答装置;\n[0012] 所述语音应答装置根据接收到的MRCP控制信息执行相应的操作。\n[0013] 可选地,所述MRCP控制信息为第一MRCP控制信息,所述第一MRCP控制信息包括:控制所述语音应答装置播报语音的第一MRCP控制指令,以及所播报的语音对应的数据存储地址;\n[0014] 所述语音应答装置根据接收到的MRCP控制信息执行相应的操作,包括:所述语音应答装置根据所述第一MRCP控制指令,获取所播报的语音对应的数据并播报语音,提示用户进行输入操作,并将用户输入的语音指令经所述MRCP承载通道发送至所述声控服务器。\n[0015] 可选地,所述语音应答装置接收到所述第一MRCP控制信息后,还包括:\n[0016] 向语音合成装置发送语音合成请求;\n[0017] 所述语音合成装置根据所述语音合成请求将所述MRCP控制信息合成为对应的语音并发送至所述声控服务器。\n[0018] 可选地,当所述语音应答装置接收到所述语音指令时,还包括:\n[0019] 所述语音应答装置将所述语音指令发送至语音转换装置;\n[0020] 所述语音转换装置将所述语音指令转换为对应的文本数据;\n[0021] 采用MRCP协议将所述语音指令对应的文本数据发送至所述声控服务器。\n[0022] 可选地,所述MRCP控制信息为第二MRCP控制信息,所述第二MRCP控制信息包括:与所述语音指令对应的应答目标信息,及控制所述语音应答装置执行所述语音指令的第二MRCP控制指令;\n[0023] 所述语音应答装置根据接收到的MRCP控制信息执行相应的操作,包括:\n[0024] 所述语音应答装置根据所述第二MRCP控制指令及应答目标信息执行所述语音指令。\n[0025] 可选地,所述应答目标信息为目标号码。\n[0026] 可选地,所述MRCP承载通道采用会话发起协议SIP作为数据承载协议。\n[0027] 可选地,所述语音应答装置通过人机交互界面或远程操控的方式接收所述语音指令。\n[0028] 可选地,在所述语音应答装置接收语音指令之前,所述方法还包括:\n[0029] 所述语音应答装置接收来自用户的触发操作;\n[0030] 根据所述触发操作向所述声控服务器发送操作请求;\n[0031] 所述声控服务器根据所述操作请求向所述语音应答装置发送对应的MRCP控制信息;\n[0032] 所述语音应答装置接收语音指令,包括:所述语音应答装置根据所述MRCP控制信息接收所述语音指令。\n[0033] 本发明实施例还提供了一种语音传输控制系统,所述系统包括:\n[0034] 语音应答装置,适于接收语音指令;采用MRCP协议将所述语音指令通过MRCP承载通道发送至声控服务器;以及根据接收到的MRCP控制信息执行相应的操作;\n[0035] 所述声控服务器,适于对所述语音指令进行语义识别;基于识别结果生成对应的MRCP控制信息;以及经所述MRCP承载通道将所述MRCP控制信息发送至所述语音应答装置。\n[0036] 可选地,所述语音应答装置包括:\n[0037] 第一接收单元,适于接收所述语音指令;\n[0038] 第一发送单元,采用MRCP协议将所述语音指令通过MRCP承载通道发送至声控服务器的MRCP服务装置;\n[0039] 操作单元,适于根据接收到的MRCP控制信息执行相应的操作;\n[0040] 所述声控服务器包括:MRCP服务装置及控制装置,其中,\n[0041] 所述控制装置包括:\n[0042] 识别单元,适于对所述语音指令进行语义识别;\n[0043] 生成单元,适于基于识别结果生成对应的MRCP控制信息;\n[0044] 所述MRCP服务装置包括:\n[0045] 第二发送单元,适于经所述MRCP承载通道将所述MRCP控制信息发送至所述语音应答装置。\n[0046] 可选地,所述生成单元生成的MRCP控制信息为第一MRCP控制信息,所述第一MRCP控制信息包括:控制所述语音应答装置播报语音的第一MRCP控制指令,以及所播报的语音对应的数据存储地址;\n[0047] 所述操作单元适于根据所述第一MRCP控制指令,获取所播报的语音对应的数据并播报语音,提示用户进行输入操作;\n[0048] 所述第一发送单元还适于将用户输入的语音指令经所述MRCP承载通道发送至所述声控服务器。\n[0049] 可选地,所述语音应答装置还适于在接收到所述第一MRCP控制信息后,向语音合成装置发送语音合成请求;\n[0050] 所述系统还包括:语音合成装置,适于根据所述语音合成请求将所述第一MRCP控制信息合成为对应的语音并发送至所述语音应答装置。\n[0051] 可选地,所述语音应答装置还适于在接收到所述语音指令时,将所述语音应答装置将所述语音指令发送至语音转换装置;\n[0052] 所述语音应答装置还适于在接收到所述语音指令时,将所述语音应答装置将所述语音指令发送至语音转换装置;\n[0053] 可选地,所述生成单元生成的MRCP控制信息为第二MRCP控制信息,所述第二MRCP控制信息包括:与所述语音指令对应的应答目标信息,及控制所述语音应答装置执行所述语音指令的第二MRCP控制指令;\n[0054] 所述操作单元适于根据所述第二MRCP控制指令及应答目标信息执行所述语音指令。\n[0055] 可选地,所述系统还包括:语音转换装置,适于将所述语音应答装置接收到的语音指令转换为对应的文本数据;\n[0056] 所述第一发送单元适于将所述语音指令对应的文本数据通过网络数据传输通道发送至所述MRCP服务装置。\n[0057] 可选地,所述生成单元生成的MRCP控制信息为第二MRCP控制信息,所述第二MRCP控制信息包括:与所述语音指令对应的应答目标信息,及控制所述语音应答装置执行所述语音指令的第二MRCP控制指令;\n[0058] 所述操作单元根据所述第二MRCP控制指令及应答目标信息执行所述语音指令。\n[0059] 可选地,所述应答目标信息为目标号码。\n[0060] 可选地,所述语音应答装置还包括:\n[0061] 第二接收单元,适于在所述语音应答装置接收语音指令之前,接收来自用户的触发操作;\n[0062] 第三发送单元,适于根据所述触发操作向所述声控服务器发送操作请求;\n[0063] 所述声控服务器还包括:\n[0064] 第四发送单元,适于根据所述操作请求向所述语音应答装置发送对应的MRCP控制信息;\n[0065] 所述语音应答装置的第一接收单元适于根据所述MRCP控制信息接收所述语音指令。\n[0066] 可选地,所述语音应答装置位于第三方服务系统,所述声控服务器集成于人工智能机器人。\n[0067] 与现有技术相比,本发明的技术方案至少具有以下优点:\n[0068] 通过采用语音应答装置接收语音指令,以及采用声控服务器识别所述语音指令,再根据识别结果生成相应的控制信息,最终由所述控制信息控制语音应答装置执行相应的操作,可以简化对语音指令进行传输控制的系统架构及工作流程。并且,采用MRCP协议作为语音应答装置及声控服务器之间的控制协议,可以有效降低对语音指令进行传输控制的设计难度。\n附图说明\n[0069] 图1是本发明实施例中一种语音传输控制系统的结构示意图;\n[0070] 图2是本发明实施例中一种语音传输控制方法的流程图;\n[0071] 图3是本发明实施例中一种语音传输控制系统的工作流程图;\n[0072] 图4是本发明实施例中一种语音应答装置的结构示意图;\n[0073] 图5是本发明实施例中一种声控服务器的结构示意图。\n具体实施方式\n[0074] 目前的企业应用系统虽然可以基于员工的语音指令实现多方通话及呼叫转移等功能,但所述企业应用系统的架构及工作流程通常较复杂,且设计难度较大。\n[0075] 针对上述问题,本发明的实施例提供了一种语音传输控制方法,所述方法通过采用语音应答装置接收语音指令,以及采用声控服务器对所述语音指令进行语义识别,进而产生相应的控制信息,由所述控制信息控制所述语音应答装置执行相应的操作,因此可以简化对语音指令进行传输控制的系统架构及工作流程。并且,采用媒体资源控制协议(Media Resource Control Protocol,MRCP)作为语音应答装置及声控服务器之间的控制协议,可以有效降低对语音指令进行传输控制的设计难度。\n[0076] 为使本发明的上述目的、特征和优点能够更为明显易懂,下面结合附图对本发明的具体实施例作详细的说明。\n[0077] 如图1所示,本发明实施例提供了一种语音传输控制系统10,所述语音传输控制系统10可以包括:语音应答装置11以及声控服务器12。所述语音应答装置11以及声控服务器\n12采用MRCP协议并通过MRCP承载通道13进行数据传输。\n[0078] 其中,所述语音应答装置11适于接收语音指令,并采用MRCP协议将所述语音指令通过MRCP承载通道13发送至声控服务器12。所述声控服务器12适于对所述语音指令进行语义识别,并基于识别结果生成对应的MRCP控制信息,以及经所述MRCP承载通道13将所述MRCP控制信息发送至所述语音应答装置11。所述语音应答装置11还适于根据接收到的MRCP控制信息执行相应的操作。\n[0079] 在具体实施中,所述语音指令可以为用户口头表达的自然语言。用户可以通过所表达的自然语言,向语音应答装置11发出相应的请求或命令。所述语音指令中可以仅包括目标对象信息,或者仅包括目标操作信息,还可以同时包括目标对象信息及目标操作信息。\n例如,所述语音指令可以为“请找销售部的宾斌”,其中,“销售部的宾斌”即为目标对象信息。所述语音指令还可以为“立刻找技术部江淮开会”,其中,“技术部江淮”即为目标对象信息,“开会”即为目标操作信息。\n[0080] 在具体实施中,所述语音应答装置11可以为单独的终端设备,比如所述语音应答装置11可以为手持终端设备、平板型设备、网络PC、小型计算机、大型计算机等;也可以位于第三方服务系统,例如,所述语音应答装置11可以为互动式语音应答系统(Interactive Voice Response,IVR)。具体无论所述语音应答装置11的形式如何,只要所述语音应答装置\n11可以接收语音指令,并将所述语音指令通过MRCP承载通道13传输至声控服务器12,以及根据所述声控服务器12生成的控制信息执行相应的应答操作即可。\n[0081] 在具体实施中,所述声控服务器12可以包括MRCP服务装置121及控制装置122。其中,所述MRCP服务装置121可以在接收到所述语音指令后,从所述语音指令的数据包中获取MRCP消息,并将所获取到的MRCP消息转换为所述控制装置122可以识别的形式,再由所述控制装置122对所述MRCP消息进行语义识别,并生成对应的控制信息。之后,所述控制装置122生成的MRCP控制信息可以经MRCP服务装置121进行发送。\n[0082] 需要说明的是,所述MRCP服务装置121及控制装置122可以分别为一台独立的专用服务器,比如,所述MRCP服务装置121可以为一台MRCP代理服务器,控制装置122为人工智能机器人。所述MRCP服务装置121及控制装置122也可以同时提供其他服务,比如可以在其他服务器上开辟一块专用的存储区和内存区,以提供语音控制服务。所述MRCP服务装置121及控制装置122还可以同时集成于一人工智能机器人。当然,不论是采用哪种方式的声控服务器12,都可以与语音应答装置11通过MRCP承载通道13相连。\n[0083] 在具体实施中,所述MRCP承载通道13可以为有线网络数据传输通道,也可以采用无线网络数据传输通道。其中,所述无线网络可以包括WiFi、蓝牙、红外等多种无线连接方式。具体无论所述语音应答装置11与所述声控服务器12之间的连接方式如何,均不构成对本发明的限制,且均在本发明的保护范围之内。\n[0084] 由于MRCP协议不是一个独立的协议,因此,基于MRCP协议的消息需要依靠其它数据传输协议的承载才能发送至对方。在本发明的一实施例中,可以采用会话发起协议(Session Initiation Protocol,SIP)作为基本的数据传输协议。通过在语音应答装置及声控服务器之间的握手动作,建立SIP协议,再通过SIP协议承载基于MRCP协议的消息,例如,将MRCP消息封装在SIP消息的消息体中,通过二者之间的SIP消息交互,使得声控服务器可以基于MRCP协议对所述语音应答装置进行控制。\n[0085] 需要说明的是,所述MRCP承载通道13还可以采用其他数据传输协议来承载MRCP消息,并不限于SIP协议。但无论采用何种数据传输协议来承载MRCP消息,均不构成对本发明的限制,且均在本发明的保护范围之内。\n[0086] 在具体实施中,所述语音传输控制系统10还可以包括语音转换装置14。所述语音应答装置11可以将所述语音指令先发送至语音转换装置14,由所述语音转换装置14将所述语音指令转换为对应的文本数据后,再采用MRCP协议将所述文本数据发送至所述声控服务器12,由所述声控服务器12对所述语音指令对应的文本数据进行相应处理。\n[0087] 其中,所述语音转换装置14与所述语音应答装置11之间可以采用实时传输协议(Real Time Transport Protocol,RTP)进行数据传输。所述语音转换装置14与所述声控服务器12之间可以采用SIP作为基本承载协议来传输基于MRCP协议的消息。\n[0088] 在具体实施中,所述语音传输控制系统10还可以包括语音合成装置15。所述语音应答装置11在接收到所述MRCP控制信息后,可以向语音合成装置15发送语音合成请求,由语音合成装置15根据所述语音合成请求将所述MRCP控制信息合成为对应的语音后,再发送至所述语音应答装置11。\n[0089] 需要说明的是,所述语音转换装置14以及语音合成装置15可以为单独的终端设备,比如所述语音应答装置11或语音合成装置15可以为手持终端设备、平板型设备、网络PC、小型计算机、大型计算机等;也可以位于第三方服务系统,例如,所述语音应答装置11可以为互动式语音应答系统(Automatic Speech Recognition,ASR),所述语音合成装置15可以为文本转语音系统(Text To Speech,TTS)。\n[0090] 为了使本领域技术人员更好地理解和实现本发明,以下对语音传输控制系统对应的方法进行详细描述。\n[0091] 如图2所述,本发明实施例提供了一种语音传输控制方法。下面结合图1对所述方法进行详细接介绍。\n[0092] 具体地,所述方法可以包括如下步骤:\n[0093] 步骤21,语音应答装置11接收语音指令。\n[0094] 在具体实施中,所述语音应答装置11可以通过多种方式接收所述语音指令。例如,可以通过人机交互界面接收所述语音指令,也可以通过远程操控的方式接收所述语音指令。\n[0095] 在具体实施中,所述语音应答装置11在接收所述语音指令之前,可以先接收来自用户的触发操作。例如,按热键“11”,来激活所述语音传输控制系统10。所述语音应答装置\n11接收来自用户的触发操作后,可以根据所述触发操作向所述声控服务器12发送操作请求。所述声控服务器12根据所述操作请求向所述语音应答装置11发送对应的MRCP控制信息,所述语音应答装置11可以根据所述MRCP控制信息执行相应的操作,例如,播放欢迎语及等待用户的语音指令等。也就是说,所述语音应答装置11可以在所述声控服务器12发送的MRCP控制信息的控制下,接收所述语音指令。\n[0096] 步骤22,采用MRCP协议将所述语音指令通过MRCP承载通道发送至声控服务器12。\n[0097] 在具体实施中,所述语音应答装置11可以将接收到的所述语音指令直接发送至声控服务器12,也可以间接发送至声控服务器12。\n[0098] 当所述语音应答装置11直接将所述语音指令发送至声控服务器12时,所述声控服务器12在识别所述语音指令时,可以先将所述语音指令转换为对应的文本数据,再进行识别。\n[0099] 当所述语音应答装置11间接将所述语音指令发送至声控服务器12时,所述语音应答装置11可以先根据MRCP协议将所述语音指令发送至语音转换装置14,再由所述语音转换装置14将所述语音指令转换为对应的文本数据。之后,所述语音转换装置14可以采用MRCP协议将所述语音指令对应的文本数据发送至所述声控服务器12。\n[0100] 步骤23,所述声控服务器12对所述语音指令进行语义识别。\n[0101] 在具体实施中,所述声控服务器12在接收到所述语音指令对应的文本数据后,可以通过对所述语音指令对应的文本数据进行模糊匹配的方式,识别所述语音指令。其中,所述模糊匹配的规则可以由本领域技术人员根据实际使用情况进行设定,例如,可以先将所述文本数据转换为对应的拼音串,再对所述拼音串进行分词处理,最后从语料数据库中搜索与分词后的拼音串对应的文字。\n[0102] 步骤24,基于识别结果生成对应的MRCP控制信息。\n[0103] 在具体实施中,所述MRCP控制信息可以为第一MRCP控制信息。所述第一MRCP控制信息可以包括:控制所述语音应答装置11播报语音的第一MRCP控制指令,以及所播报的语音对应的数据存储地址。\n[0104] 其中,所播报的语音可以存储在所述语音应答装置11中,也可以存储在声控服务器12中,还可以存储在其他设备中,具体所播报的语音的存储介质不作限定,只要所述语音应答装置11可以获取到所播报的语音即可。\n[0105] 在具体实施中,所述声控服务器12生成的第一MRCP控制信息可以是语音数据的形式,也可以是文本数据的形式。当所述第一MRCP控制信息为文本数据形式时,所述语音应答装置11可以向语音合成装置15发送语音合成请求,由语音合成装置15先根据所述语音合成请求将所述第一MRCP控制信息合成对应的语音,再发送至所述声控服务器12。\n[0106] 在具体实施中,所述MRCP控制信息也可以为第二MRCP控制信息。所述第二MRCP控制信息可以包括:与所述语音指令对应的应答目标信息,及控制所述语音应答装置执行所述语音指令的第二MRCP控制指令。例如,所述应答目标信息可以为目标号码。其中,与所述语音指令对应的应答目标信息,可以是与用户第一次输入的语音指令所对应的应答目标信息,也可以是与用户在后续使用过程中输入的任何一次语音指令所对应的应答目标信息。\n[0107] 需要说明的是,所述应答目标信息可以存储在所述语音应答装置11中,也可以存储在声控服务器12中,还可以存储在其他设备中,具体所述应答目标信息的存储介质不作限定,只要所述声控服务器12可以获取到所述应答目标信息即可。\n[0108] 步骤25,经所述MRCP承载通道13将所述MRCP控制信息发送至所述语音应答装置\n11。\n[0109] 步骤26,所述语音应答装置11根据接收到的MRCP控制信息执行相应的操作。\n[0110] 具体地,当所述MRCP控制信息为第一MRCP控制信息时,所述语音应答装置11可以根据所述第一MRCP控制指令,获取所播报的语音对应的数据并播报语音,提示用户进行输入操作,并将用户输入的语音指令经所述MRCP承载通道13发送至所述声控服务器12。\n[0111] 当所述MRCP控制信息为第二MRCP控制信息时,所述语音应答装置11可以根据所述第二MRCP控制指令及应答目标信息执行所述语音指令。\n[0112] 例如,所述应答目标信息为目标号码时,所述语音应答装置11可以根据所述第二MRCP控制指令拨打目标号码,实现多方通话等功能。\n[0113] 下面以所述语音应答装置11为IVR,语音转换装置14为ASR,语音合成装置15为TTS,声控服务器12为人工智能机器人为例,对使用所述语音传输控制系统实现实时电话会议的工作流程进行详细描述,其中,所述声控服务器12包括MRCP服务装置121及控制装置\n122。\n[0114] 具体地,如图3所示,所述语音传输控制系统的工作流程可以包括如下步骤:\n[0115] 步骤s1,用户呼叫接入IVR 11;\n[0116] 步骤s2,IVR 11接收实时电话会议的语音指令;\n[0117] 步骤s3,IVR 11将所述语音指令发送至ASR 14;\n[0118] 步骤s4,ASR 14对所述语音指令转换为对应的文本数据;\n[0119] 步骤s5,ASR 14将所述文本数据发送至MRCP服务装置121;\n[0120] 步骤s6,MRCP服务装置121将所述文本数据发送至控制装置122;\n[0121] 步骤s7,控制装置122对所述文本数据进行语义识别,并生成第一MRCP控制信息,所述第一MRCP控制信息用于控制IVR 11播报语音并提示用户语音指令;\n[0122] 步骤s8,控制装置122将所述第一MRCP控制信息发送至MRCP服务装置121;\n[0123] 步骤s9,MRCP服务装置121将所述第一MRCP控制信息发送至IVR 11;\n[0124] 步骤s10,IVR 11向TTS 15发送合成请求;\n[0125] 步骤s11,TTS 15根据所述合成请求将所述MRCP控制信息合成为对应的语音;\n[0126] 步骤s12,TTS 15将所述MRCP控制信息对应的语音发送至IVR 11;\n[0127] 步骤s13,IVR 11播报语音并提示用户输入语音指令;\n[0128] 步骤s14,用户向IVR 11输入语音指令;\n[0129] 步骤s15,IVR 11将用户输入的语音指令发送至ASR 14;\n[0130] 步骤s16,ASR 14对所述用户输入的语音指令转换为对应的文本数据;\n[0131] 步骤s17,ASR 14将所述文本数据发送至MRCP服务装置121;\n[0132] 步骤s18,MRCP服务装置121将所述文本数据发送至控制装置122;\n[0133] 步骤s19,控制装置122对所述文本数据进行语义识别,并生成第二MRCP控制信息,所述第二MRCP控制信息用于控制IVR 11执行所述语音指令;\n[0134] 步骤s20,控制装置122将所述第二MRCP控制信息发送至MRCP服务装置121;\n[0135] 步骤s21,MRCP服务装置121将所述第二MRCP控制信息发送至IVR 11;\n[0136] 步骤s22,IVR 11执行所述语音指令。\n[0137] 为了使得本领域技术人员更加清楚地实施所述语音传输控制系统10,下面对所述语音传输系统10进行详细介绍:\n[0138] 在本发明的一实施例中,如图4所示,所述语音应答装置11可以包括:第一接收单元41,第一发送单元42以及操作单元43。其中,所述第一接收单元41适于接收所述语音指令。所述第一发送单元42适于采用MRCP协议将所述语音指令通过MRCP承载通道13发送至声控服务器12的MRCP服务装置121。所述操作单元43适于根据接收到的MRCP控制信息执行相应的操作。\n[0139] 在本发明的一实施例中,如图5所示,所述声控服务器12可以包括:MRCP服务装置\n121及控制装置122。其中,所述控制装置122可以包括:识别单元51及生成单元52。所述识别单元51适于对所述语音指令进行语义识别。所述生成单元52适于基于识别结果生成对应的控制信息。所述MRCP服务装置121包括:第二发送单元53。所述第二发送单元53适于经所述MRCP承载通道13将所述MRCP控制信息发送至所述语音应答装置11。\n[0140] 下面结合图4及图5,对所述语音传输控制系统进行详细介绍:\n[0141] 在具体实施中,所述第一接收单元41可以通过多种方式接收所述语音指令。例如,所述第一接收单元51可以通过人机交互界面接收所述语音指令,也可以通过远程操控的方式接收所述语音指令。\n[0142] 所述语音指令可以经语音转换装置14转换为对应的文本数据后,再由所述语音转换装置14将所述语音指令对应的文本数据通过MRCP承载通道13发送至声控服务器12。\n[0143] 所述MRCP服务装置121接收到所述语音指令对应的文本数据后,将所述文本数据发送至控制装置122。由所述控制装置122的识别单元51对所述语音指令对应的文本数据进行模糊匹配,以识别所述语音指令。再由生成单元52根据所述语音指令生成MRCP控制信息。\n[0144] 在具体实施中,所述生成单元52生成的MRCP控制信息可以为第一MRCP控制信息,也可以为第二MRCP控制信息。其中,所述第一MRCP控制信息可以包括:控制所述语音应答装置播报语音的第一MRCP控制指令,以及所播报的语音对应的数据存储地址。所述第二MRCP控制信息可以包括:与所述语音指令对应的应答目标信息,及控制所述语音应答装置执行所述语音指令的第二MRCP控制指令。其中,所述应答目标信息可以为目标号码。\n[0145] 当所述生成单元52生成的MRCP控制信息为第一MRCP控制信息时,所述语音应答装置11适于在接收到所述第一MRCP控制信息后,向语音合成装置15发送语音合成请求,由所述语音合成装置15根据所述语音合成请求将所述第一MRCP控制信息合成为对应的语音并发送至所述语音应答装置11。所述操作单元43适于根据所述第一MRCP控制指令,获取所播报的语音对应的数据并播报语音,提示用户进行输入操作,所述第一发送单元42还适于将用户输入的语音指令经所述MRCP承载通道发送至所述声控服务器12。\n[0146] 当所述生成单元52生成的MRCP控制信息为第二MRCP控制信息时,所述操作单元43适于根据所述第二MRCP控制指令获取并执行所述语音指令。\n[0147] 在具体实施中,所述语音应答装置11还可以包括:第二接收单元(未示出)以及第三发送单元(未示出)。其中,所述第二接收单元适于在所述语音应答装置接收语音指令之前,接收来自用户的触发操作。所述第三发送单元适于根据所述触发操作向所述声控服务器发送操作请求。\n[0148] 相应地,所述声控服务器12可以包括:第四发送单元54(未示出)。所述第四发送单元54适于根据所述操作请求向所述语音应答装置发送对应的MRCP控制信息。此时,所述语音应答装置11的第一接收单元41适于根据所述第MRCP控制信息接收所述语音指令。\n[0149] 由上述内容可以看出,本发明实施例中的语音传输控制系统系统架构以及工作流程较简单,且通过将控制信息设置为MRCP控制信息,可以极大降低语音传输控制系统的设计难度。\n[0150] 本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。\n[0151] 虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。
法律信息
- 2022-12-16
专利实施许可合同备案的生效
IPC(主分类): G10L 15/26
合同备案号: X2022980023270
专利申请号: 201510560931.1
申请日: 2015.09.06
让与人: 上海智臻智能网络科技股份有限公司
受让人: 上海临港融资租赁有限公司
发明名称: 语音传输控制方法及系统
申请公布日: 2015.12.30
授权公告日: 2019.05.10
许可种类: 独占许可
备案日期: 2022.11.28
- 2022-12-09
专利权质押合同登记的生效
专利号: ZL 201510560931.1
申请日: 2015.09.06
授权公告日: 2019.05.10
登记号: Y2022980023447
登记生效日: 2022.11.24
出质人: 上海智臻智能网络科技股份有限公司
质权人: 上海临港融资租赁有限公司
发明名称: 语音传输控制方法及系统
- 2019-05-10
- 2016-01-27
实质审查的生效
IPC(主分类): G10L 15/26
专利申请号: 201510560931.1
申请日: 2015.09.06
- 2015-12-30
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2015-06-24
|
2013-12-18
| | |
2
| |
2009-06-10
|
2007-11-30
| | |
3
| |
2007-09-05
|
2007-04-11
| | |
4
| |
2013-05-22
|
2011-07-11
| | |
5
| |
2007-06-20
|
2006-11-13
| | |
6
| |
2013-06-12
|
2013-01-28
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |