一种基于图像去噪的语音识别方法及装置

发明专利有效专利

申请号：
CN201910818956.5
IPC分类号：G10L15/25;G10L15/20;G10L15/14;G10L21/0208;G10L25/30;G10L25/57
申请日期：
2019-08-30
申请人：
上海依图信息技术有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	一种基于图像去噪的语音识别方法及装置
申请号	CN201910818956.5	申请日期	2019-08-30
法律状态	实质审查	申报国家	中国
公开/公告日	2019-11-26	公开/公告号	CN110503957A
优先权	暂无	优先权号	暂无
主分类号	G10L15/25 ? IPC结构图谱： G 物理 G0 仪器 G10 乐器；声学 G10L 语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码〔4〕 G10L15/00 语音识别（G10L 17/00优先）〔7，2013.01〕 G10L15/24 利用非声学特征的语音识别〔7，2013.01〕 G10L15/25 使用嘴唇位置，嘴唇运动或者脸部分析〔2013.01〕	IPC分类号	G;1;0;L;1;5;/;2;5;;;G;1;0;L;1;5;/;2;0;;;G;1;0;L;1;5;/;1;4;;;G;1;0;L;2;1;/;0;2;0;8;;;G;1;0;L;2;5;/;3;0;;;G;1;0;L;2;5;/;5;7查看分类表>
申请人	上海依图信息技术有限公司	申请人地址	上海市浦东新区耀华路488号1901E室变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	上海依图信息技术有限公司	当前权利人	上海依图信息技术有限公司
发明人	李索恒;汪俊;郑达;张志齐
代理机构	北京同达信恒知识产权代理有限公司	代理人	柴燕梅

摘要

本发明涉及通信技术领域，特别涉及一种基于图像去噪的语音识别方法及装置。该方法为：获取第一时段采集的音频信号；将所述第一时段采集的视频信号进行人脸识别，确定包含说话对象的图像帧；所述说话对象为根据所述视频信号中的图像帧中同一人脸的唇动特征确定的；将所述包含说话对象的图像帧与所述第一时段采集的音频信号进行帧对齐；将帧对齐后的所述包含说话对象的图像帧与所述第一时段采集的音频信号输入至语音识别模型中，确定所述说话对象的语音识别结果。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供