加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种自组织麦克风阵列语音识别通道选择方法

发明专利有效专利
  • 申请号:
    CN202110462105.9
  • IPC分类号:G10L15/28;G10L15/06;G10L15/20
  • 申请日期:
    2021-04-27
  • 申请人:
    西北工业大学;西北工业大学深圳研究院
著录项信息
专利名称一种自组织麦克风阵列语音识别通道选择方法
申请号CN202110462105.9申请日期2021-04-27
法律状态实质审查申报国家中国
公开/公告日2021-08-06公开/公告号CN113223534A
优先权暂无优先权号暂无
主分类号G10L15/28IPC分类号G;1;0;L;1;5;/;2;8;;;G;1;0;L;1;5;/;0;6;;;G;1;0;L;1;5;/;2;0查看分类表>
申请人西北工业大学;西北工业大学深圳研究院申请人地址
陕西省西安市友谊西路127号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人西北工业大学,西北工业大学深圳研究院当前权利人西北工业大学,西北工业大学深圳研究院
发明人张晓雷;陈俊淇;陈益江
代理机构西北工业大学专利中心代理人金凤
摘要
本发明公开了一种自组织麦克风阵列语音识别通道选择方法,该方法通过设计一种针对大规模自组织麦克风阵列语音识别任务下基于Scaling Spasemax的通道选择算法,将含噪程度高的通道权重置零从而对通道做出选择,以达到更低的语音识别错误率。具体框架如下:(1)采用编码器‑解码器架构,其中编码器基于Conformer框架,解码器基于Transformer框架,并在编码器‑解码器模块中引入多头注意力机制。(2)对于单通道语音识别系统,采用干净语音单独训练。(3)对于多通道语音识别系统,将各个通道语音编码后共享同一个解码器,并基于流注意力机制设计融合层,以此对各个通道做出选择后融合。实验结果表明本专利方法在大规模自组织麦克风阵列下较其他方法语音识别准确率更高。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供