加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于Tensorflow的语音融合方法、电子装置及存储介质

发明专利有效专利
  • 申请号:
    CN201910566906.2
  • IPC分类号:G10L21/007;G10L25/18;G10L25/30;G06N3/04;G06N3/08
  • 申请日期:
    2019-06-27
  • 申请人:
    平安科技(深圳)有限公司
著录项信息
专利名称基于Tensorflow的语音融合方法、电子装置及存储介质
申请号CN201910566906.2申请日期2019-06-27
法律状态实质审查申报国家中国
公开/公告日2019-10-01公开/公告号CN110299148A
优先权暂无优先权号暂无
主分类号G10L21/007IPC分类号G;1;0;L;2;1;/;0;0;7;;;G;1;0;L;2;5;/;1;8;;;G;1;0;L;2;5;/;3;0;;;G;0;6;N;3;/;0;4;;;G;0;6;N;3;/;0;8查看分类表>
申请人平安科技(深圳)有限公司申请人地址
广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人平安科技(深圳)有限公司当前权利人平安科技(深圳)有限公司
发明人张鹏
代理机构北京鸿元知识产权代理有限公司代理人暂无
摘要
本发明涉及人工智能技术领域,本发明提出一种基于Tensorflow的语音融合方法、电子装置及计算机可读存储介质,其中的方法包括将内容语音浮点数据和风格语音浮点数据通过STFT等变化转换成内容语音频谱图和风格语音频谱图;通过过滤器模板分别对两种语音频谱图进行特征提取,获取两种语音的声学特征,并创建loss函数;通过Tensorflow的优化器对loss函数进行迭代优化,当loss函数的差值最小时,确定待融合的内容语音数据和风格语音数据;将待融合的语音数据进行ISTFT等变换;通过librosa将ISTFT等变换处理后的待融合的内容语音数据和风格语音数据合成MP3格式的语音。本发明通过基于Tensorflow将不同风格的语音融合在一起,为说话声自动增加背景音乐、智能创造新音乐,从而为用户提供更多地体验。

专利服务由北京酷爱智慧知识产权代理公司提供