用于模拟机陆空通话环境的语音合成/整合方法和系统

发明专利有效专利

申请号：
CN201310183789.4
IPC分类号：G10L13/033;G10L13/08;G06F17/28
申请日期：
2013-05-17
申请人：
珠海翔翼航空技术有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	用于模拟机陆空通话环境的语音合成/整合方法和系统
申请号	CN201310183789.4	申请日期	2013-05-17
法律状态	授权	申报国家	中国
公开/公告日	2013-09-18	公开/公告号	CN103310783A
优先权	暂无	优先权号	暂无
主分类号	G10L13/033 ? IPC结构图谱： G 物理 G0 仪器 G10 乐器；声学 G10L 语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码〔4〕 G10L13/00 语音合成；文本-语音合成系统〔7〕 G10L13/02 产生合成语音的方法；语音合成设备〔7，2013.01〕 G10L13/033 声音编辑，例如操控合成器的声音〔2013.01〕	IPC分类号	G;1;0;L;1;3;/;0;3;3;;;G;1;0;L;1;3;/;0;8;;;G;0;6;F;1;7;/;2;8查看分类表>
申请人	珠海翔翼航空技术有限公司	申请人地址	广东省珠海市吉大石花西路163号变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	珠海翔翼航空技术有限公司	当前权利人	珠海翔翼航空技术有限公司
发明人	干宇雷;阮文新;吴林;杨实;白杨
代理机构	广州嘉权专利商标事务所有限公司	代理人	陈国荣

摘要

本发明公开了一种用于模拟机陆空通话环境的语音合成/整合方法和系统，根据陆空通话内容及类型，进行相关的发音匹配，形成对应的语音发音，然后对语音发音进行优化，使语音发音符合模拟时的语音环境，最后形成对应的语音音频并输出至相关的设备。本发明通过最大程度地模拟飞行所处空域的语音环境，从这些细节处更好地培训飞行员，全面提升飞行员的技能，从而减少甚至消除飞行员在真实飞行时的失误，提升培训的质量和效益。

1.一种用于模拟机陆空通话环境的语音合成/整合方法，其特征在于，包括以下步骤：
步骤A，获取陆空通话内容及所述陆空通话内容对应的中英文语音类别；
步骤B，对步骤A中所述陆空通话内容进行进行格式转换得出对应的语音合成/整合调用参数；
步骤C，调用语音生成服务接口，传递语音合成/整合调用参数至语音生成服务器，语音生成服务器根据陆空通话内容生成对应的语音音频文件；
步骤D，通过语音生成服务接口输出生成的语音音频文件。
2.根据权利要求1所述的一种用于模拟机陆空通话环境的语音合成/整合方法，其特征在于：步骤A中所述的中英文语音类别包括中文类别、英文类别及中英文混合类别。
3.根据权利要求1所述的一种用于模拟机陆空通话环境的语音合成/整合方法，其特征在于，所述步骤C中语音生成服务器根据陆空通话内容生成对应的语音音频文件包括以下步骤：
步骤C1，根据陆空通话内容及其对应的中英文语音类别匹配对应的语音发音，对其中特定的缩写词语根据预制录音匹配特定的语音发音；
步骤 C2，对产生的语音发音进行优化，调节语音发音的音速、音高，模拟出一个最合适的语音音频。
4.一种用于模拟机陆空通话环境的语音合成/整合系统，其特征在于，包括：语音生成服务器，用于接收陆空通话语音内容，并把陆空通话语音内容转换成为对应的语音音频输出至相关设备；所述语音生成服务器包括：
语音生成接口模块，外部连接输入或输出设备，用于接收或输出语音模拟信号或文件；
该模块在接收到陆空通话内容后，陆空通话内容会被转换成相应的音频格式文件；
中英文语音库，与语音生成接口模块连接，包含有中文、英文及中英混合语音库，用于生成相关语言的语音音频模拟信号或文件；
语音生成效果优化模块，与语音生成接口模块和中英文语音库连接，用于对生成的语音音频进行优化，对特定的缩写词语进行预制录音匹配，并调节生成的语音音频的语速和音高，形成最优的语音音频。

用于模拟机陆空通话环境的语音合成/整合方法和系统\n技术领域\n[0001] 本发明涉及语音领域，特别是一种用于模拟机陆空通话环境的语音合成/整合方法和系统。\n背景技术\n[0002] 全动模拟机是用于飞行员培训的一种模拟设备，约15-20架飞机就需要至少一套全动模拟机。全动模拟机可提供人工操纵、自动驾驶等多种训练模式和多达几百项的故障模拟，同时可完善模拟白天、黑夜、下雨、云雾、打雷等不同类型场景，为飞行员全面掌握操纵技能提供充分的培训，最大限度确保飞行安全。\n[0003] 在真实飞行环境中，飞行员需要遵从各类空中管制指令并做出适当应答。这一过程包括在适当的时机调频适当的无线电台，报告当前飞行情况数据并侦听有关空中管制员发出的指令，执行空中管制指令并做出应答。我们统称这类空中管制单位与飞机间的管制对话为陆空通话，陆空通话是贯穿整个飞行过程并且关系到飞行安全的重要过程。\n[0004] 陆空通话环境的模拟系统对飞行员的培训具有重大意义，可以真实地模拟飞行环境中的语音环境，使仿真程度更加相近，全面提升飞行员的飞行水平。模拟机陆空通话环境的模拟系统一般至少包括一台或多台模拟机及与模拟机一一相对应的模拟机陆空通话系统/通用设备，模拟机至少包括有模拟机飞行参数采集模块和模拟机音频接口模块，模拟机陆空通话系统/通用设备至少包括分布式数据库模块、区域识别判定算法模块及语音调度算法模块。模拟机飞行参数采集模块中的参数采集模块可以采集模拟机运行时的状态参数，而模拟机飞行参数采集设备中的参数发送模块可以将采集的状态参数发送至对应的模拟机陆空通话系统/通用设备。模拟机陆空通话系统/通用设备接收模拟机飞行参数采集模块发送的参数数据后，通过区域识别判定算法模块调用分布式数据库模块中的管制区域多维数据库进行管制区域判断，获得所处空中管制区域列表，再由语音调度算法模块调用分布式数据库模块中的陆空通话规则库匹配相关陆空通话规则从而形成最优的陆空通话语音内容，陆空通话语音内容经转换处理形成对应的语音音频，语音音频被传送至模拟机的音频接口模块，从而实现模拟机的语音通话。\n[0005] 在真实的飞行环境中，不同空域的频率是不一样的，指令发音的语速和音量等也是不同的。在进行飞行员培训时，飞行员在模拟机中根据接收的飞行指令完成相应的动作，在模拟机模拟处于不同的空域时，如何使陆空通话语音内容转变成对应空域中对应频率的语音音频，从而更好好模拟现实的陆空通话语音环境，提高培训质量，减少真实操作时的失误率。\n发明内容\n[0006] 为解决上述问题，本发明的目的在于提供一种用于模拟机陆空通话环境的语音合成/整合方法和系统，可以根据陆空通话的内容，匹配相关发音，并对形成的发音进行优化，形成一个最优的语音音频。\n[0007] 本发明解决其问题所采用的技术方案是：\n[0008] 一种用于模拟机陆空通话环境的语音合成/整合方法，包括以下步骤：\n[0009] 步骤A，获取陆空通话内容及所述陆空通话内容对应的中英文语音类别；\n[0010] 步骤B，对步骤A中所述陆空通话内容进行进行格式转换得出对应的语音合成/整合调用参数；\n[0011] 步骤C，调用语音生成服务接口，传递语音合成/整合调用参数至语音生成服务器，语音生成服务器根据陆空通话内容生成对应的语音音频文件；\n[0012] 步骤D，通过语音生成服务接口输出生成的语音音频文件。\n[0013] 进一步，步骤A中所述的中英文语音类别包括中文类别、英文类别及中英文混合类别。\n[0014] 进一步，所述步骤C中语音生成服务器根据陆空通话内容生成对应的语音音频文件包括以下步骤：\n[0015] 步骤C1，根据陆空通话内容及其对应的中英文语音类别匹配对应的语音发音，对其中特定的缩写词语根据预制录音匹配特定的语音发音；\n[0016] 步骤 C2，对产生的语音发音进行优化，调节语音发音的音速、音高，模拟出一个最合适的语音音频。\n[0017] 一种用于模拟机陆空通话环境的语音合成/整合系统，其特征在于，包括：语音生成服务器，用于接收陆空通话内容，并把陆空通话内容转换成为对应的语音音频输出至相关设备。\n[0018] 进一步，所述语音生成服务器包括：\n[0019] 语音生成接口模块，外部连接输入或输出设备，用于接收或输出语音模拟信号或文件；\n[0020] 中英文语音库，与语音生成接口模块连接，包含有中文、英文及中英混合语音库，用于生成相关语言的语音音频模拟信号或文件；\n[0021] 语音生成效果优化模块，与语音生成接口模块和中英文语音库连接，用于对生成的语音音频进行优化，对特定的缩写词语进行预制录音匹配，并调节生成的语音音频的语速和音高，形成最优的语音音频。\n[0022] 本发明的有益效果是：\n[0023] 本发明采用一种用于模拟机陆空通话环境的语音合成/整合方法和系统，根据接收的陆空通话内容，包括中文、英文或中英混合类型，匹配相应的语音发音，并对形成的发音进行语音优化，形成一个最佳的语音音频，这样可以更真实的模拟现实飞行环境中的语音环境，进一步提升飞行员的飞行能力，减少真实操作时的失误率。\n附图说明\n[0024] 下面结合附图和实例对本发明作进一步说明。\n[0025] 图1是本发明所述方法流程图；\n[0026] 图2是本发明所述系统结构组成框图。\n具体实施方式\n[0027] 模拟机陆空通话环境的模拟系统在对模拟机所处空域进行识别后，会根据所在空域利用语音调度算法模块调用分布式数据库模块中的陆空通话规则库匹配相关陆空通话规则从而形成最优的陆空通话语音内容，所形成的语音通话内容是模拟性质的指令内容，这些指令内容包括特定缩写的词语和/或一般的用语。这些指令内容需要转换成可以发音的语音音频。\n[0028] 参照图1所述本发明所述方法流程图，首先获取陆空通话内容及其类别，陆空通话内容可以是语音音频模拟信号或文件，其类别可以是中文、英文或中英文混合。第二，根据陆空通话内容进行进行格式转换得出对应的语音合成/整合调用参数，此过程会把陆空通话内容转换成对应的语音音频格式或文件。第三，调用语音生成服务接口，传递语音合成/整合调用参数至语音生成服务器，语音生成服务器根据陆空通话内容及其对应的中英文语音类别匹配对应的语音发音，对于是中文内容，则匹配中文发音，对于英文内容，则匹配英文发音，对于混合内容，则匹配相应的中英文发音，同时语音生成服务器会对其中特定的缩写词语根据预制录音匹配特定的语音发音，之后语音生成服务器会对产生的语音发音进行优化，调节语音发音的音速、音高等，模拟出一个最合适的语音音频。最后，生成的语音音频会通过语音生成服务接口输出至相关的设备。\n[0029] 需要说明的是，本发明中的预制录音是提前录制的，包括有特定词语的录制，这些词语包含中文和英文。语音发音经过优化之后，其发音会与所处飞行区域相一致，最大程序地与现实中的语音环境相匹配，从而更好地从平时的细节中对飞行员进行培训，快速地提升飞行员的飞行能力，减少甚至消除真实飞行时可能遇到的失误。\n[0030] 参照图2所示本发明所述系统结构组成框图，包括语音生成服务器，语音生成服务器包括语音生成接口模块、中英文语音库和语音生成效果优化模块，所述语音生成接口模块、中英文语音库和语音生成效果优化模块之间两两互相连接。语音生成接口模块可以接收陆空通话内容，也可以把生成后的语音音频输出至相关设备；语音生成接口模块在接收到陆空通话内容后，陆空通话内容会被转换成相应的音频格式文件，中英文语音库包含有中文、英文及中英混合语音库，根据生成的音频格式文件，把相应的语音内容生成对应的语音音频模拟信号或文件，若陆空通话是中文，则会形成对应的普通话语音音频模拟信号或文件，若陆空通话是英文，则会形成标准的英文发音的语音音频模拟信号或文件，若陆空通话是中英文混合，则形成混合发音的语音音频模拟信号或文件；语音生成效果优化模块可以对生成的语音音频进行优化，对特定的中英文词语进行预制录音匹配，形成与真实环境相一致的特定发音，同时调节语音发音的音速、音高等，从而模拟出一个最合适的语音音频。\n[0031] 以上所述，只是本发明的较佳实施例而已，本发明并不局限于上述实施方式，只要其以相同的手段达到本发明的技术效果，都应属于本发明的保护范围。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN101785048A	2010-07-21	2008-08-19	基于HMM的双语(普通话-英语)TTS技术有效专利	微软公司
2	CN1758671A	2006-04-12	2005-04-25	具有把拍摄文字转换为语音功能的移动通信终端及其方法无效专利	乐金电子(中国)研究开发中心有限公司

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供