加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于DBLSTM+CTC声学模型的语音识别方法

发明专利有效专利
  • 申请号:
    CN201911142225.X
  • IPC分类号:G10L15/02;G10L15/05;G10L15/06;G10L15/18
  • 申请日期:
    2019-11-20
  • 申请人:
    武汉水象电子科技有限公司
著录项信息
专利名称一种基于DBLSTM+CTC声学模型的语音识别方法
申请号CN201911142225.X申请日期2019-11-20
法律状态实质审查申报国家暂无
公开/公告日2020-04-14公开/公告号CN111009236A
优先权暂无优先权号暂无
主分类号G10L15/02IPC分类号G;1;0;L;1;5;/;0;2;;;G;1;0;L;1;5;/;0;5;;;G;1;0;L;1;5;/;0;6;;;G;1;0;L;1;5;/;1;8查看分类表>
申请人武汉水象电子科技有限公司申请人地址
湖北省武汉市武昌区和平大道1178号武汉理工大学余家头校区内北园一栋502-13(工位) 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人武汉水象电子科技有限公司当前权利人武汉水象电子科技有限公司
发明人袁熹;柳慧芬
代理机构北京汇泽知识产权代理有限公司代理人郑飞
摘要
一种基于DBLSTM+CTC声学模型的语音识别方法,所述方法包括:步骤1,获取实时语音信号,对所述语音信号进行特征抽取,获得逐帧的声学特征序列;步骤2,将所述声学特征序列作为DBLSTM+CTC声学模型的输入,并输出音素序列;步骤3,建立音素序列转文字序列的解码模型,将所述音素序列作为所述解码模型的输入,并通过所述解码模型输出文字序列。本发明为基于两级端到端(seq2seq)的语音识别方法,包括“语音‑音素序列”的端到端模型以及“音素序列‑文字序列”,区别现有“语音‑文字序列”的端到端模型,两个模型均不需要超大规模的语料训练,且两部分能够优势互补,在一定程度上,语言模型能够弥补在声学模型在噪声环境下的不足。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供