加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于线性自注意力的语音合成方法及系统

发明专利有效专利
  • 申请号:
    CN202111007669.X
  • IPC分类号:G10L13/08;G10L25/30
  • 申请日期:
    2021-08-30
  • 申请人:
    中国科学院声学研究所
著录项信息
专利名称一种基于线性自注意力的语音合成方法及系统
申请号CN202111007669.X申请日期2021-08-30
法律状态公开申报国家暂无
公开/公告日2021-11-26公开/公告号CN113707127A
优先权暂无优先权号暂无
主分类号G10L13/08IPC分类号G;1;0;L;1;3;/;0;8;;;G;1;0;L;2;5;/;3;0查看分类表>
申请人中国科学院声学研究所申请人地址
北京市海淀区北四环西路21号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国科学院声学研究所当前权利人中国科学院声学研究所
发明人张鹏远;张浩哲;颜永红
代理机构北京亿腾知识产权代理事务所(普通合伙)代理人陈霁
摘要
本申请涉及一种基于线性自注意力的语音合成方法和系统,所述方法包括:根据音频进行处理,获得对应文本的音素序列;根据所述音素序列通过神经网络编码器得到第一文本特征序列;所述神经网络编码器用于对所述音素序列进行线性自注意力计算和乘性位置编码以得到第一文本特征序列;根据所述第一文本特征序列通过时长预测模型扩增得到第二文本特征序列;根据所述第二文本特征序列通过神经网络解码器得到对应的梅尔谱特征序列;根据所述梅尔谱特征序列通过神经网络声码器得到转换后的语音。本申请以线性的时间、空间复杂度输出梅尔谱,输入神经网络声码器得到语音。该方法解决了传统并行语音合成声学模型时间、空间复杂度较高的问题。

专利服务由北京酷爱智慧知识产权代理公司提供