一种基于注意力机制的语音增强算法

发明专利无效专利

申请号：
CN201910535424.0
IPC分类号：G10L21/0264;G10L25/30;G06N3/02
申请日期：
2019-06-18
申请人：
电子科技大学

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	一种基于注意力机制的语音增强算法
申请号	CN201910535424.0	申请日期	2019-06-18
法律状态	驳回	申报国家	中国
公开/公告日	2019-10-01	公开/公告号	CN110299149A
优先权	暂无	优先权号	暂无
主分类号	G10L21/0264 ? IPC结构图谱： G 物理 G0 仪器 G10 乐器；声学 G10L 语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码〔4〕 G10L21/00 为了改变语音或声音信号的质量或其可识度而处理语音或声音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号（G10L 19/00优先）〔7，2013.01〕 G10L21/02 语音增强，例如降低噪声或消除回声（在直线传送系统中减轻回声效应入H04B 3/20；免提电话中的回声抑制入H04M 9/08）〔7，2013.01〕 G10L21/0208 噪声过滤〔2013.01〕 G10L21/0216 以噪声估计使用的方法为特征的〔2013.01〕 G10L21/0264 以参数测量的类型为特征的，如相关技术，零交叉技术或预测技术〔2013.01〕	IPC分类号	G;1;0;L;2;1;/;0;2;6;4;;;G;1;0;L;2;5;/;3;0;;;G;0;6;N;3;/;0;2查看分类表>
申请人	电子科技大学	申请人地址	四川省成都市建设北路二段四号变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	电子科技大学	当前权利人	电子科技大学
发明人	蓝天;李萌;惠国强;刘峤;吕忆蓝;钱雨欣;叶文政;彭川;李森
代理机构	成都环泰知识产权代理事务所（特殊普通合伙）	代理人	暂无

摘要

本发明公开了一种基于注意力机制的语音增强算法，构造了一个基于注意力机制的神经网络语音增强模型，包括三个组件一个基于注意力机制的神经网络、一个标准深度循环神经网络和一个时频掩蔽层。模型在每一个时间步，将当前时刻的输入帧与整段语音帧进行注意力机制计算，得到当前时间步对应的特征向量表达。通过将当前时间步特征向量与当前语音帧进行拼接得到模型输入，利用标准的深度循环神经网络对当前输入进行编码，得到时频掩蔽的预测值。将时频掩蔽的预测值与混合语音进行按位相乘，得到增强后的语音片段。本发明所述算法从提升模型泛化性能的角度对语音增强问题进行建模，可以有效地解决在训练中未出现过的噪声场景下的语音增强问题。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供