一种基于生成对抗网络的虚拟人声视唱方法和系统

发明专利有效专利

申请号：
CN202010590728.X
IPC分类号：G10H1/00;G06N3/08;G06N3/04
申请日期：
2020-06-24
申请人：
厦门大学

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	一种基于生成对抗网络的虚拟人声视唱方法和系统
申请号	CN202010590728.X	申请日期	2020-06-24
法律状态	实质审查	申报国家	暂无
公开/公告日	2020-10-23	公开/公告号	CN111816148A
优先权	暂无	优先权号	暂无
主分类号	G10H1/00 ? IPC结构图谱： G 物理 G0 仪器 G10 乐器；声学 G10H 电声乐器；由机电装置或电子发生器产生音调的乐器，或从数据存储器合成音调的乐器 G10H1/00 电声乐器的零部件（也可适用于其他乐器的键盘入G10B，G10C；用于产生混响或回声的装置入G10K 15/08）〔5〕	IPC分类号	G;1;0;H;1;/;0;0;;;G;0;6;N;3;/;0;8;;;G;0;6;N;3;/;0;4查看分类表>
申请人	厦门大学	申请人地址	福建省厦门市思明区思明南路422-37号变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	厦门大学	当前权利人	厦门大学
发明人	吴清强;刘昆宏;张敬峥;吴苏悦;宗雁翔;朱何莹
代理机构	北京金咨知识产权代理有限公司	代理人	严业福

摘要

本发明提供了一种基于生成对抗网络的虚拟人声视唱方法和系统，所述方法包括：步骤一、输入abc记谱法文件和用Vocaloid制作的人声唱谱音频；步骤二、将abc文件转化为自定义格式的文本文件，将自定义文本文件和人声音频作为Tacotron‑2神经网络模型的输入；步骤三、在Tacotron‑2神经网络中，输入的文本文件中的字符通过512维的字符嵌入CharacterEmbedding表示；步骤四、完成了虚拟人声波形文件的合成；步骤五、得到一段完整的虚拟人声视唱音乐。本发明用虚拟人声演唱乐谱，输出的语音节奏流畅自然，从而使得听者在聆听信息时会感觉自然，而不会感到设备的语音输出带有机械感与生涩感。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供