加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于图像去噪的语音识别方法及装置

发明专利有效专利
  • 申请号:
    CN201910818956.5
  • IPC分类号:G10L15/25;G10L15/20;G10L15/14;G10L21/0208;G10L25/30;G10L25/57
  • 申请日期:
    2019-08-30
  • 申请人:
    上海依图信息技术有限公司
著录项信息
专利名称一种基于图像去噪的语音识别方法及装置
申请号CN201910818956.5申请日期2019-08-30
法律状态实质审查申报国家中国
公开/公告日2019-11-26公开/公告号CN110503957A
优先权暂无优先权号暂无
主分类号G10L15/25IPC分类号G;1;0;L;1;5;/;2;5;;;G;1;0;L;1;5;/;2;0;;;G;1;0;L;1;5;/;1;4;;;G;1;0;L;2;1;/;0;2;0;8;;;G;1;0;L;2;5;/;3;0;;;G;1;0;L;2;5;/;5;7查看分类表>
申请人上海依图信息技术有限公司申请人地址
上海市浦东新区耀华路488号1901E室 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人上海依图信息技术有限公司当前权利人上海依图信息技术有限公司
发明人李索恒;汪俊;郑达;张志齐
代理机构北京同达信恒知识产权代理有限公司代理人柴燕梅
摘要
本发明涉及通信技术领域,特别涉及一种基于图像去噪的语音识别方法及装置。该方法为:获取第一时段采集的音频信号;将所述第一时段采集的视频信号进行人脸识别,确定包含说话对象的图像帧;所述说话对象为根据所述视频信号中的图像帧中同一人脸的唇动特征确定的;将所述包含说话对象的图像帧与所述第一时段采集的音频信号进行帧对齐;将帧对齐后的所述包含说话对象的图像帧与所述第一时段采集的音频信号输入至语音识别模型中,确定所述说话对象的语音识别结果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供