加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

使用神经网络以目标讲话者的话音从文本合成语音

发明专利有效专利
  • 申请号:
    CN201980033235.1
  • IPC分类号:G10L13/033;G10L13/04;G10L25/30
  • 申请日期:
    2019-05-17
  • 申请人:
    谷歌有限责任公司
著录项信息
专利名称使用神经网络以目标讲话者的话音从文本合成语音
申请号CN201980033235.1申请日期2019-05-17
法律状态实质审查申报国家中国
公开/公告日2021-04-20公开/公告号CN112689871A
优先权暂无优先权号暂无
主分类号G10L13/033IPC分类号G;1;0;L;1;3;/;0;3;3;;;G;1;0;L;1;3;/;0;4;;;G;1;0;L;2;5;/;3;0查看分类表>
申请人谷歌有限责任公司申请人地址
美国加利福尼亚州 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人谷歌有限责任公司当前权利人谷歌有限责任公司
发明人贾晔;陈智峰;吴永辉;乔纳森·沈;庞若鸣;罗恩·J·韦斯;伊格纳西奥·洛佩斯·莫雷诺;任飞;张羽;王泉;帕特里克·安·蒲·阮
代理机构中原信达知识产权代理有限责任公司代理人周亚荣;邓聪惠
摘要
用于语音合成的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。所述方法、系统和装置包括以下动作:获得目标讲话者的语音的音频表示;获得将要以目标讲话者的话音合成语音的输入文本;通过将所述音频表示提供给被训练以将讲话者彼此区分开的讲话者编码器引擎来生成讲话者矢量;通过将所述输入文本和讲话者矢量提供给已使用参考讲话者的话音进行训练以生成音频表示的声谱图生成引擎来生成以所述目标讲话者的话音讲出的所述输入文本的音频表示;以及提供以所述目标讲话者的话音讲出的所述输入文本的所述音频表示以进行输出。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供