著录项信息
专利名称 | 电子系统及其嵌入式设备和中转设备 |
申请号 | CN201010596778.5 | 申请日期 | 2010-12-20 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2012-07-04 | 公开/公告号 | CN102546542A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | H04L29/06 | IPC分类号 | H;0;4;L;2;9;/;0;6;;;G;1;0;L;1;5;/;2;6查看分类表>
|
申请人 | 福建星网视易信息系统有限公司 | 申请人地址 | 福建省福州市金山大道618号橘园洲星网锐捷科技园20#4层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 福建星网视易信息系统有限公司 | 当前权利人 | 福建星网视易信息系统有限公司 |
发明人 | 卢廉瑾;冯锐;郭峰;郑维宏 |
代理机构 | 深圳市博锐专利事务所 | 代理人 | 张明 |
摘要
本发明公开了一种电子系统及其嵌入式设备和中转设备。所述系统包括:语音采集设备、嵌入式客户端、中转设备以及服务器;所述语音采集设备连接所述嵌入式客户端,所述中转设备连接在嵌入式客户端和服务器之间;其中,所述嵌入式客户端控制语音采集设备进行语音采集并得到语音数据,所述中转设备用于将所述语音数据发送至所述服务器进行语音识别,并将所述服务器语音识别得到的识别结果反馈回所述嵌入式客户端。本发明能够让语音识别技术轻易地应用于嵌入式设备中,对嵌入式设备的要求低,并且可以屏蔽嵌入式设备和语音识别服务器各自的变化,使得通用的语音识别引擎能够适用于不同的嵌入式应用系统。
1.一种电子系统,其特征在于,包括:
语音采集设备、嵌入式客户端、中转设备以及服务器;
所述语音采集设备连接所述嵌入式客户端,所述中转设备连接在嵌入式客户端和服务器之间;
其中,所述嵌入式客户端控制语音采集设备进行语音采集并得到语音数据,所述中转设备用于将所述语音数据发送至所述服务器进行语音识别,并将所述服务器语音识别得到的识别结果反馈回所述嵌入式客户端;
所述中转设备与所述嵌入式客户端之间采用局域网的TCP/IP连接,所述中转设备与所述服务器之间采用局域网的TCP/IP连接;
所述中转设备是具有独立主机的中转设备,且包括连接所述独立主机和嵌入式客户端的网卡;
所述独立主机包括:
语音识别引擎接口和初始化语音识别资源;
连接单元,用于通过所述网卡接收来自嵌入式客户端的TCP连接请求,并通过所述网卡建立中转设备与嵌入式客户端之间的TCP/IP连接;
控制包接收单元,用于建立所述TCP/IP连接后,通过所述网卡接收来自嵌入式客户端的UDP控制包,所述UDP控制包包含:采样率、声道数和语音编码格式,以此请求开始语音识别;
初始化单元,用于在接收开始语音识别请求后,调用语音识别引擎接口,初始化语音识别资源,并在初始化成功后通过所述网卡回复对应所述UDP控制包的通知给嵌入式客户端设备;
数据接收单元,用于在回复所述通知给嵌入式客户端设备后,通过所述网卡接收来自嵌入式客户端的语音数据;
数据发送单元,用于调用所述语音识别引擎接口将语音数据传送给服务器;
结果返回单元,用于将来自服务器的识别结果通过UDP转发给嵌入式客户端。
2.根据权利要求1所述的电子系统,其特征在于,进一步包括:
格式转化单元,用于在数据接收单元接收到语音数据后、在数据发送单元发送语音数据前,对所述语音数据进行采样率转换,转换为服务器可以识别的语音数据格式,交由所述数据发送单元发送。
3.一种应用于嵌入式设备的中转设备,其特征在于,包括:
独立主机、连接所述独立主机和嵌入式客户端的网卡;
其中,所述独立主机通过所述网卡接收来自所述嵌入式客户端的语音数据,将语音数据发送至外接服务器进行语音识别,并将所述服务器语音识别得到的识别结果反馈回所述嵌入式客户端;
所述独立主机包括:
语音识别引擎接口和初始化语音识别资源;
连接单元,用于通过所述网卡接收来自嵌入式客户端的TCP连接请求,并通过所述网卡建立独立主机与嵌入式客户端之间的TCP/IP连接;
控制包接收单元,用于建立所述TCP/IP连接后,通过所述网卡接收来自嵌入式客户端的UDP控制包,所述UDP控制包包含:采样率、声道数和语音编码格式,以此请求开始语音识别;
初始化单元,用于在接收开始语音识别请求后,调用语音识别引擎接口,初始化语音识别资源,并在初始化成功后通过所述网卡回复对应所述UDP控制包的通知给嵌入式客户端设备;
数据接收单元,用于在回复所述通知给嵌入式客户端设备后,通过所述网卡接收来自嵌入式客户端的语音数据;
数据发送单元,用于调用所述语音识别引擎接口将语音数据传送给服务器;
结果返回单元,用于将来自服务器的识别结果通过UDP转发给嵌入式客户端。
4.根据权利要求3所述的设备,其特征在于,进一步包括:
格式转化单元,用于在数据接收单元接收到语音数据后、在数据发送单元发送语音数据前,对所述语音数据进行采样率转换,转换为服务器可以识别的语音数据格式,交由所述数据发送单元发送。
电子系统及其嵌入式设备和中转设备\n技术领域\n[0001] 本发明涉及电子技术领域,特别是涉及嵌入式娱乐产品。\n背景技术\n[0002] 模式识别技术,指的是对外部世界某一特定环境中的客体、过程和现象的识别功能(包括视觉、听觉、触觉、判断等)进行模拟的科学技术。近年来,此项技术在在计算机智能领域取得了迅速的发展,已经取得了系统的研究成果。\n[0003] 语音识别是模式识别技术中的一项典型应用,它正逐步成为信息技术中人机接口(HCI)的关键技术。作为一个新兴高技术产业,语音识别技术已经有了不少较为成熟的识别引擎可以利用,中国科学院声学研究所的中科信利语音平台是其中之一。\n[0004] 语言音识别技术使得使用者和计算机之间能够进行直接的感官交流,因此如果能将其运用于娱乐产品,必将前所未有地提升用户感受,也可以引申出许多新的娱乐运用。\n[0005] 第一、目前的模式识别技术需要消耗的极大的软硬件资源:首先、其复杂的浮点运算要求有高性能的处理器和容量巨大的内存;其次,语音识别需要较大的比照样本库,会耗费相当多的存储空间。因此,此技术对运行平台有着极为苛刻的要求,是以嵌入式设备为主的数字娱乐设备所不能负担的。如何突破软硬件瓶颈,在嵌入式设备上运用此项技术,是需要嵌入式软件开发者面临的问题。\n[0006] 第二、目前的嵌入式识别引擎都是基于x86硬件和windows平台而开发的,但嵌入式产品平台的架构和操作系统则可能千变万化。不可能让单一的语音识别引擎去迁就各种不同的硬件平台。为此如何让语音识别引擎能够适应各种不同的嵌入式设备,使得两者能够相对独立,不受对方的影响,也是嵌入式软件开发者面临的问题。\n[0007] 关于语音识别技术的应用,还可以参阅2001年10月03日公开了一种名为“客户服务器语音信息传送系统与方法”的中国发明专利申请第00109844.6号。所述系统包括至少一个服务器站和客户站;客户站包括:用于接收来自用户的语音输入信号的装置;和用于将表示所接收的语音的信号通过公共因特网传送到服务器站的装置;以及服务器站包括:用于接收来自公共因特网的语音等效信号的装置;和用于识别所接收的语音等效信号的大/巨大词汇量语音识别器;客户站包括本地语音识别器和语音控制器;语音控制器能将至少部分语音输入信号导入本地语音识别器中,并根据识别结果选择性地将一部分语音输入信号通过公共因特网导入服务器站中。\n发明内容\n[0008] 本发明主要解决的技术问题是提供一种电子系统及其嵌入式设备和中转设备,能够让语音识别技术轻易地应用于嵌入式设备中,对嵌入式设备的要求低,并且可以屏蔽嵌入式设备和语音识别服务器各自的变化,使得通用的语音识别引擎能够适用于不同的嵌入式应用系统。\n[0009] 为解决上述技术问题,本发明采用的一个技术方案是:提供一种电子系统,包括:\n语音采集设备、嵌入式客户端、中转设备以及服务器;所述语音采集设备连接所述嵌入式客户端,所述中转设备连接在嵌入式客户端和服务器之间;其中,所述嵌入式客户端控制语音采集设备进行语音采集并得到语音数据,所述中转设备用于将所述语音数据发送至所述服务器进行语音识别,并将所述服务器语音识别得到的识别结果反馈回所述嵌入式客户端。\n[0010] 其中,所述中转设备与所述嵌入式客户端之间采用局域网的TCP/IP连接,所述中转设备与所述服务器之间采用局域网的TCP/IP连接。\n[0011] 其中,所述中转设备是具有独立主机的中转设备,且包括连接所述独立主机和嵌入式客户端的网卡。\n[0012] 其中,所述独立主机包括:语音识别引擎接口和初始化语音识别资源;连接单元,用于通过所述网卡接收来自嵌入式客户端的TCP连接请求,并通过所述网卡建立中转设备与嵌入式客户端之间的TCP/IP连接;控制包接收单元,用于建立所述TCP/IP连接后,通过所述网卡接收来自嵌入式客户端的UDP控制包,所述UDP控制包包含:采样率、声道数和语音编码格式,以此请求开始语音识别;初始化单元,用于在接收开始语音识别请求后,调用语音识别引擎接口,初始化语音识别资源,并在初始化成功后通过所述网卡回复对应所述UDP控制包的通知给嵌入式客户端设备;数据接收单元,用于在回复所述通知给嵌入式客户端设备后,通过所述网卡接收来自嵌入式客户端的语音数据;数据发送单元,用于调用所述语音识别引擎接口将语音数据传送给服务器;结果返回单元,用于将来自服务器的识别结果通过UDP转发给嵌入式客户端。\n[0013] 其中,进一步包括:格式转化单元,用于在数据接收单元接收到语音数据后、在数据发送单元发送语音数据前,对所述语音数据进行采样率转换,转换为服务器可以识别的语音数据格式,交由所述数据发送单元发送。\n[0014] 本发明还提供一种嵌入式设备,包括:嵌入式客户端;所述嵌入式客户端具有连接外接语音采集设备的第一接口、以及连接外接中转设备的第二接口;其中,所述嵌入式客户端经第一接口接收语音采集设备采集得到的语音数据,经所述第二接口将语音数据向外接中转设备发送,并经所述第二接口接收所述语音数据的识别结果。\n[0015] 其中,所述嵌入式客户端的接口采用局域网的TCP/IP连接所述外接中转设备。\n[0016] 本发明又提供一种应用于嵌入式设备的中转设备,包括:独立主机、连接所述独立主机和嵌入式客户端的网卡;其中,所述独立主机通过所述网卡接收来自所述嵌入式客户端的语音数据,将语音数据发送至外接服务器进行语音识别,并将所述服务器语音识别得到的识别结果反馈回所述嵌入式客户端。\n[0017] 其中,所述独立主机包括:语音识别引擎接口和初始化语音识别资源;连接单元,用于通过所述网卡接收来自嵌入式客户端的TCP连接请求,并通过所述网卡建立独立主机与嵌入式客户端之间的TCP/IP连接;控制包接收单元,用于建立所述TCP/IP连接后,通过所述网卡接收来自嵌入式客户端的UDP控制包,所述UDP控制包包含:采样率、声道数和语音编码格式,以此请求开始语音识别;初始化单元,用于在接收开始语音识别请求后,调用语音识别引擎接口,初始化语音识别资源,并在初始化成功后通过所述网卡回复对应所述UDP控制包的通知给嵌入式客户端设备;数据接收单元,用于在回复所述通知给嵌入式客户端设备后,通过所述网卡接收来自嵌入式客户端的语音数据;数据发送单元,用于调用所述语音识别引擎接口将语音数据传送给服务器;结果返回单元,用于将来自服务器的识别结果通过UDP转发给嵌入式客户端。\n[0018] 其中,格式转化单元,用于在数据接收单元接收到语音数据后、在数据发送单元发送语音数据前,对所述语音数据进行采样率转换,转换为服务器可以识别的语音数据格式,交由所述数据发送单元发送。\n[0019] 本发明的有益效果是:区别于现有技术电子系统中语音识别技术难以应用的情况,本发明能将语音数据的采集工作和对语音数据的处理识别工作从物理上分开成3个子系统:资源较少能力较弱的嵌入式设备只负责采集和发送数据并接收结果;中转设备能够将语音数据传送到具有语音识别引擎的服务器,接收到识别结果后回传给嵌入式设备;由于识别引擎安装在服务器上,因此有着丰富的软硬件资源,且在资源不够的时候,可以通过增加新的服务器来解决。语音识别引擎可以由第三方提供;同时,各个子系统间只要遵守一定的协议即可连接,因此可以相对降低各个子系统的关联性:中转设备的设置,可以屏蔽嵌入式前台和语音识别后台各自的变化,使得通用的语音识别引擎能够适用于不同的嵌入式应用系统;采用了以上的方案后,嵌入式设备绕开了资源的瓶颈限制,同时突破了固定运行平台的局限,使得原本代价高昂的语音识别技术能够实际可行地运用于嵌入式平台上的娱乐设备。\n附图说明\n[0020] 图1是本发明电子系统实施方式一的原理框图;\n[0021] 图2是本发明电子系统实施方式二的原理框图;\n[0022] 图3是本发明电子系统实施方式三的原理框图;\n[0023] 图4是本发明中控制信息通讯包的结构示意图;\n[0024] 图5是本发明中数据信息通讯包的结构示意图。\n具体实施方式\n[0025] 参阅图1,本发明电子系统实施方式包括:\n[0026] 语音采集设备(图未示)、嵌入式客户端、中转设备以及服务器;\n[0027] 所述语音采集设备连接所述嵌入式客户端,所述中转设备连接在嵌入式客户端和服务器之间,图中用嵌入式设备来代替语音采集设备和嵌入式客户端;\n[0028] 其中,所述嵌入式客户端控制语音采集设备进行语音采集并得到语音数据,所述中转设备用于将所述语音数据发送至所述服务器进行语音识别,并将所述服务器语音识别得到的识别结果反馈回所述嵌入式客户端。\n[0029] 本发明能将语音数据的采集工作和对语音数据的处理识别工作从物理上分开成\n3个子系统:资源较少能力较弱的嵌入式设备只负责采集和发送数据并接收结果;中转设备能够将语音数据传送到具有语音识别引擎的服务器,接收到识别结果后回传给嵌入式设备;由于识别引擎安装在服务器上,因此有着丰富的软硬件资源,且在资源不够的时候,可以通过增加新的服务器来解决。语音识别引擎可以由第三方提供;\n[0030] 同时,各个子系统间只要遵守一定的协议即可连接,因此可以相对降低各个子系统的关联性:中转设备的设置,可以屏蔽嵌入式前台和语音识别后台各自的变化,使得通用的语音识别引擎能够适用于不同的嵌入式应用系统;\n[0031] 采用了以上的方案后,嵌入式设备绕开了资源的瓶颈限制,同时突破了固定运行平台的局限,使得原本代价高昂的语音识别技术能够实际可行地运用于嵌入式平台上的娱乐设备。\n[0032] 在另一个实施方式中,所述中转设备与所述嵌入式客户端之间采用局域网的TCP/IP连接,所述中转设备与所述服务器之间采用局域网的TCP/IP连接。当然,所述中转设备与所述嵌入式客户端之间也可以不采用局域网连接,或不采用TCP/IP连接,所有的连接方式都是可以考虑的,比如无线连接方式。\n[0033] 在另一个实施方式中,所述中转设备是具有独立主机的中转设备,且包括连接所述独立主机和嵌入式客户端的网卡。当然也可以不具有独立主机,比如采用与其他应用兼容的系统等。\n[0034] 参阅图2,在另一个实施方式中,所述独立主机包括:\n[0035] 语音识别引擎接口和初始化语音识别资源;\n[0036] 连接单元,用于通过所述网卡接收来自嵌入式客户端的TCP连接请求,并通过所述网卡建立中转设备与嵌入式客户端之间的TCP/IP连接;\n[0037] 控制包接收单元,用于建立所述TCP/IP连接后,通过所述网卡接收来自嵌入式客户端的UDP控制包,所述UDP控制包包含:采样率、声道数和语音编码格式,以此请求开始语音识别;\n[0038] 初始化单元,用于在接收开始语音识别请求后,调用语音识别引擎接口,初始化语音识别资源,并在初始化成功后通过所述网卡回复对应所述UDP控制包的通知给嵌入式客户端设备;\n[0039] 数据接收单元,用于在回复所述通知给嵌入式客户端设备后,通过所述网卡接收来自嵌入式客户端的语音数据;\n[0040] 数据发送单元,用于调用所述语音识别引擎接口将语音数据传送给服务器;\n[0041] 结果返回单元,用于将来自服务器的识别结果通过UDP转发给嵌入式客户端。\n[0042] 参阅图3,在另一个实施方式中,进一步包括:格式转化单元,用于在数据接收单元接收到语音数据后、在数据发送单元发送语音数据前,对所述语音数据进行采样率转换,转换为服务器可以识别的语音数据格式,交由所述数据发送单元发送。经数据格式转化,使各系统之间的屏蔽效果更好。\n[0043] 还参阅图1,本发明还提供一种嵌入式设备实施方式,包括:\n[0044] 嵌入式客户端;\n[0045] 所述嵌入式客户端具有连接外接语音采集设备如麦克风的第一接口(图未示)、以及连接外接中转设备的第二接口(图未示)比如网卡;\n[0046] 其中,所述嵌入式客户端经第一接口接收语音采集设备采集得到的语音数据,经所述第二接口将语音数据向外接中转设备发送,并经所述第二接口接收所述语音数据的识别结果。\n[0047] 上述实施方式能够让语音识别技术轻易地应用于嵌入式设备中,对嵌入式设备的要求低,并且可以屏蔽嵌入式设备和语音识别服务器各自的变化,使得通用的语音识别引擎能够适用于不同的嵌入式应用系统。\n[0048] 在另外一个实施方式中,所述嵌入式客户端的接口采用局域网的TCP/IP连接所述外接中转设备。当然也可以采用城域网、互联网等连接方式。\n[0049] 还参阅图1,本发明又提供一种应用于嵌入式设备的中转设备实施方式,包括:\n[0050] 独立主机、连接所述独立主机(图未示)和嵌入式客户端的网卡(图未示);\n[0051] 其中,所述独立主机通过所述网卡接收来自所述嵌入式客户端的语音数据,将语音数据发送至外接服务器进行语音识别,并将所述服务器语音识别得到的识别结果反馈回所述嵌入式客户端。\n[0052] 上述中转设备,使语音识别技术应用于嵌入式设备时,可以屏蔽嵌入式设备和语音识别服务器各自的变化,使得通用的语音识别引擎能够适用于不同的嵌入式应用系统。\n[0053] 嵌入式设备和具体的识别引擎之间使用中转设备如中转网关接口和调度,使得嵌入式设备的功能和使用具体的识别引擎(服务器)无关,可以方便更换。\n[0054] 还参阅图2,在另外一个实施方式中,所述独立主机还进一步包括:\n[0055] 语音识别引擎接口和初始化语音识别资源;\n[0056] 连接单元,用于通过所述网卡接收来自嵌入式客户端的TCP连接请求,并通过所述网卡建立独立主机与嵌入式客户端之间的TCP/IP连接;\n[0057] 控制包接收单元,用于建立所述TCP/IP连接后,通过所述网卡接收来自嵌入式客户端的UDP控制包,所述UDP控制包包含:采样率、声道数和语音编码格式,以此请求开始语音识别;\n[0058] 初始化单元,用于在接收开始语音识别请求后,调用语音识别引擎接口,初始化语音识别资源,并在初始化成功后通过所述网卡回复对应所述UDP控制包的通知给嵌入式客户端设备;\n[0059] 数据接收单元,用于在回复所述通知给嵌入式客户端设备后,通过所述网卡接收来自嵌入式客户端的语音数据;\n[0060] 数据发送单元,用于调用所述语音识别引擎接口将语音数据传送给服务器;\n[0061] 结果返回单元,用于将来自服务器的识别结果通过UDP转发给嵌入式客户端。\n[0062] 还参阅图3,另外,还可以进一步包括:\n[0063] 格式转化单元,用于在数据接收单元接收到语音数据后、在数据发送单元发送语音数据前,对所述语音数据进行采样率转换,转换为服务器可以识别的语音数据格式,交由所述数据发送单元发送。\n[0064] 以上各子系统的具体运作过程可以如下:\n[0065] 1)嵌入式设备端按照制定协议与中转设备建立会话;\n[0066] 2)嵌入式设备端负责从麦克风采集音频数据;\n[0067] 一个会话由一个采用UDP连接的控制通讯和采用TCP的纯数据通讯实现;TCP的数据连接保证了数据传输的可靠性,同时纯数据包保证在即使发生包粘连的时候,也不会影响数据的准确性;UDP的控制连接可以减少连接的数量,减轻并发时中转设备的负载,同时,即使局域网内的UDP通信经测试基本是稳定可靠的;\n[0068] 其中,对于分发中转设备端:\n[0069] 1)中转设备负责接收嵌入式设备的连接请求,管理并转发所有会话;\n[0070] 2)接收嵌入式设备发来的语音数据后,进行一次重采样,将pcm数据转换成符合语音识别引擎(服务器)要求的数据;\n[0071] 3)将重采样后的数据,通过识别接口发往识别服务器集群,并搜集他们的识别结果反馈;\n[0072] 4)将识别结果发还给嵌入式设备;\n[0073] 其中,针对识别服务器集群和识别引擎:\n[0074] 1)真正耗费资源的工作全部在识别服务器集群中的识别引擎上完成,这个服务器集群对嵌入式设备是透明的;\n[0075] 2)当识别技术更新或者服务器负载不够时,仅需要维护此服务器集群即可,不会牵扯前端的改动。\n[0076] 其中,对于中转设备而言:\n[0077] 一、物理连接\n[0078] 1)中转设备(中转网关)和嵌入式客户端处在统一局域网中。即在物理上,中转设备可以是一台独立主机,且可以通过一张网卡和许多嵌入式客户端相连于一个局域网中;\n[0079] 2)中转设备的另一端,应该以某种方式和识别服务器的集群连接,这取决于所采用的语音识别引擎的设计,和这种应用方式本身无关,而这一点正式设立中转设备的目的之一,即屏蔽嵌入式设备和具体采用的第三方语音识别引擎间依赖关系,使之各自的变化都不会影响到另一端;\n[0080] 3)中转设备和嵌入式客户端的通信采用局域网的TCP/IP连接,能够保证足够的传输速率;通信的协议是视易自定义的适合于局域网特点的通信协议,即采用UDP控制包和TCP连接的数据包组合的协议。在一个具体实施方式中,所述协议详情可以参考如下;\n[0081] 一、通讯接口定义:\n[0082] 1、系统通讯模式:\n[0083] (1)控制信息通讯包:UDP;\n[0084] (2)数据信息通讯包:TCP;\n[0085] 2、数据包大小:最大不超过4096字节;\n[0086] 3、端口号:\n[0087] (1)UDP控制信息通讯端口:\n[0088] 发送端口:10010;\n[0089] 接收端口:10011;\n[0090] (2)TCP数据信息通讯端口:(可分别对应一个音频输入流)\n[0091] 通道一端口:10020;\n[0092] 通道二端口:10022;\n[0093] 4、适用系统:应用中科信利语音平台的系统;\n[0094] 二、通讯方式简要说明:\n[0095] 1、控制信息通讯:\n[0096] (1)控制信息指的是申请语音传输开始、申请语音传输结束、结果反馈、后台状态通知(检测到语音开始、结束)、后台强制终止,等等;\n[0097] (2)控制信息通讯采用UDP方式,保证数据包边界独立;\n[0098] 2、数据信息通讯:\n[0099] (1)数据信息指的是采集的音频数据流;\n[0100] (2)数据信息通讯采用TCP方式,发送数据为裸数据,无封装结构,在保证数据可靠传输的情况下,避免数据粘连造成的影响;\n[0101] (3)每个音频数据流对应一个TCP连接;\n[0102] 三、协议格式图:\n[0103] 在语音平台通信中,采用以下两种格式协议:\n[0104] 1、控制信息通讯包,如图4:\n[0105] 2、数据信息通讯包,如图5:\n[0106] 四、协议格式简要说明:\n[0107] (一)、控制信息通讯包:\n[0108] 协议包括包头和正文两部分,其中包头部分采用固定长度32字节,正文部分的长度在包头的“正文长度”字段中予以给出。\n[0109] 0、通讯方式:UDP\n[0110] 1、下面对包头部分各字段作一简单说明:\n[0111] \n[0112] \n[0113] 2、主消息号、子消息号定义:\n[0114] \n[0115] 3、消息正文定义:\n[0116] \n[0117] \n[0118] (二)、数据信息通讯包:\n[0119] 0、通讯方式:TCP\n[0120] 1、消息正文定义:\n[0121] \n[0122] 中转设备和第三方识别服务器集群的连接虽然取决于语音识别引擎的设计,但是可以满足一些要求,如方便的连接方式、足够的数据通讯速率等,因此常常也采用的是局域网连接。\n[0123] 二、设立中转设备的目的\n[0124] 1)将嵌入式客户端和第三方语音识别引擎在物理和逻辑连接上分开,不使其直接耦合,尽量让一端的变化——如数据的格式、识别接口、数据通信协议等变化——不影响到另一端;\n[0125] 2)一方面,嵌入式客户端只需能做到采集语音以及遵守和中转设备的若干通信协议即可运用语音识别功能,而无需对嵌入式设备附加更多要求,进一步降低了能运用语音识别服务的嵌入式设备的门槛;\n[0126] 3)另一方面,不同的第三方识别引擎对传入数据的参数——如编码类型、采用率、声道数等——皆有不同的需求,且嵌入式客户端不一定能够全部满足,因此中转设备的另一个功能是可以对原始数据进行少量的适配处理,称为重采样,将嵌入式设备传来的原始数据转为符合语音识别引擎所需规格的识别用数据;\n[0127] 三、工作机制\n[0128] 中转网关和嵌入式设备之间使用UDP协议的控制流加TCP协议的语音数据流组合的通信连接。中转网关和第三方识别引擎的连接遵守识别引擎的接口要求。\n[0129] 一次典型的通信过程如下:\n[0130] 1)当嵌入式设备想要进行语音识别时,首先向中转设备发起TCP连接请求;\n[0131] 2)当TCP连接请求被接受并成功连接后,嵌入式设备向中转设备发送UDP控制包,包信息需要包含以下信息:采样率、声道数和语音编码格式等,以此请求开始语音数据传输;\n[0132] 3)当中转设备监听到机顶盒的“开始语音识别”的请求后,调用语音识别引擎接口,初始化语音识别器资源,初始化成功后,回复对应UDP控制包,通知嵌入式设备可以传输语音数据;。\n[0133] 4)嵌入式设备如机顶盒开始通过TCP连接向中转设备传输语音数据;\n[0134] 5)中转设备收到语音数据,对语音数据进行采样率转换,转换为语音识别引擎可以识别的语音数据格式;\n[0135] 6)转换完毕后,调用识别引擎提供的接口,将转换后的语音数据传送给识别引擎,等待识别引擎返回识别结果;\n[0136] 7)将结果通过UDP转发给嵌入式设备,一次语音识别结束。\n[0137] 本发明系统和设备可应用于娱乐领域、科教领域或会议场景领域等。\n[0138] 以上所述仅为本发明的实施方式,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
法律信息
- 2015-04-29
- 2015-04-08
著录事项变更
发明人由卢廉瑾 冯锐 郭峰变更为卢廉瑾 冯锐 郭峰 郑维宏
- 2012-09-05
实质审查的生效
IPC(主分类): H04L 29/06
专利申请号: 201010596778.5
申请日: 2010.12.20
- 2012-07-04
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| | 暂无 |
2008-02-22
| | |
2
| |
2002-05-29
|
2000-03-07
| | |
3
| |
2003-07-02
|
2002-04-09
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |