基于Tensorflow的语音融合方法、电子装置及存储介质

发明专利有效专利

申请号：
CN201910566906.2
IPC分类号：G10L21/007;G10L25/18;G10L25/30;G06N3/04;G06N3/08
申请日期：
2019-06-27
申请人：
平安科技（深圳）有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	基于Tensorflow的语音融合方法、电子装置及存储介质
申请号	CN201910566906.2	申请日期	2019-06-27
法律状态	实质审查	申报国家	中国
公开/公告日	2019-10-01	公开/公告号	CN110299148A
优先权	暂无	优先权号	暂无
主分类号	G10L21/007 ? IPC结构图谱： G 物理 G0 仪器 G10 乐器；声学 G10L 语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码〔4〕 G10L21/00 为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号（G10L 19/00优先）〔7，2013.01〕 G10L21/003 改变声音质量，例如音调或共振峰〔2013.01〕 G10L21/007 以所使用的处理为特征的〔2013.01〕	IPC分类号	G;1;0;L;2;1;/;0;0;7;;;G;1;0;L;2;5;/;1;8;;;G;1;0;L;2;5;/;3;0;;;G;0;6;N;3;/;0;4;;;G;0;6;N;3;/;0;8查看分类表>
申请人	平安科技（深圳）有限公司	申请人地址	广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	平安科技（深圳）有限公司	当前权利人	平安科技（深圳）有限公司
发明人	张鹏
代理机构	北京鸿元知识产权代理有限公司	代理人	暂无

摘要

本发明涉及人工智能技术领域，本发明提出一种基于Tensorflow的语音融合方法、电子装置及计算机可读存储介质，其中的方法包括将内容语音浮点数据和风格语音浮点数据通过STFT等变化转换成内容语音频谱图和风格语音频谱图；通过过滤器模板分别对两种语音频谱图进行特征提取，获取两种语音的声学特征，并创建loss函数；通过Tensorflow的优化器对loss函数进行迭代优化，当loss函数的差值最小时，确定待融合的内容语音数据和风格语音数据；将待融合的语音数据进行ISTFT等变换；通过librosa将ISTFT等变换处理后的待融合的内容语音数据和风格语音数据合成MP3格式的语音。本发明通过基于Tensorflow将不同风格的语音融合在一起，为说话声自动增加背景音乐、智能创造新音乐，从而为用户提供更多地体验。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供