加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于生成对抗网络的虚拟人声视唱方法和系统

发明专利有效专利
  • 申请号:
    CN202010590728.X
  • IPC分类号:G10H1/00;G06N3/08;G06N3/04
  • 申请日期:
    2020-06-24
  • 申请人:
    厦门大学
著录项信息
专利名称一种基于生成对抗网络的虚拟人声视唱方法和系统
申请号CN202010590728.X申请日期2020-06-24
法律状态实质审查申报国家暂无
公开/公告日2020-10-23公开/公告号CN111816148A
优先权暂无优先权号暂无
主分类号G10H1/00IPC分类号G;1;0;H;1;/;0;0;;;G;0;6;N;3;/;0;8;;;G;0;6;N;3;/;0;4查看分类表>
申请人厦门大学申请人地址
福建省厦门市思明区思明南路422-37号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人厦门大学当前权利人厦门大学
发明人吴清强;刘昆宏;张敬峥;吴苏悦;宗雁翔;朱何莹
代理机构北京金咨知识产权代理有限公司代理人严业福
摘要
本发明提供了一种基于生成对抗网络的虚拟人声视唱方法和系统,所述方法包括:步骤一、输入abc记谱法文件和用Vocaloid制作的人声唱谱音频;步骤二、将abc文件转化为自定义格式的文本文件,将自定义文本文件和人声音频作为Tacotron‑2神经网络模型的输入;步骤三、在Tacotron‑2神经网络中,输入的文本文件中的字符通过512维的字符嵌入CharacterEmbedding表示;步骤四、完成了虚拟人声波形文件的合成;步骤五、得到一段完整的虚拟人声视唱音乐。本发明用虚拟人声演唱乐谱,输出的语音节奏流畅自然,从而使得听者在聆听信息时会感觉自然,而不会感到设备的语音输出带有机械感与生涩感。

专利服务由北京酷爱智慧知识产权代理公司提供