加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种用于说话人无关的唇语识别方法及系统

发明专利有效专利
  • 申请号:
    CN202110226432.4
  • IPC分类号:G06K9/00;G06N3/04;G06N3/08
  • 申请日期:
    2021-03-01
  • 申请人:
    西安邮电大学
著录项信息
专利名称一种用于说话人无关的唇语识别方法及系统
申请号CN202110226432.4申请日期2021-03-01
法律状态实质审查申报国家中国
公开/公告日2021-06-11公开/公告号CN112949481A
优先权暂无优先权号暂无
主分类号G06K9/00IPC分类号G;0;6;K;9;/;0;0;;;G;0;6;N;3;/;0;4;;;G;0;6;N;3;/;0;8查看分类表>
申请人西安邮电大学申请人地址
陕西省西安市长安街618号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人西安邮电大学当前权利人西安邮电大学
发明人路龙宾;宁都;金小敏;滑文强;孙涛
代理机构北京高沃律师事务所代理人刘凤玲
摘要
本发明涉及一种用于说话人无关的唇语识别方法及系统,所述方法包括:获取训练唇语图片序列;将训练唇语图片序列输入身份与语义深度耦合模型中,得到特征序列并计算各个网络的损失;以各种加权损失作为优化目标,对耦合模型和唇语预测网络进行迭代寻优,得到最优识别模型;将待测图片序列输入识别模型中,得到识别文本。本发明分别对唇语图片序列的身份特征与语义特征编码,以不同样本身份对比损失以及相同样本不同帧的身份差异损失对身份编码过程进行约束,以监督损失对语义编码过程进行约束,并采用身份与语义耦合重建网络对学习的身份与语义特征进行约束,有效的避免语义特征混入身份信息,提高了唇语识别模型在说话人无关条件下的识别准确率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供