一种基于决策层融合的音视频关键词识别方法

专利类型:
发明专利(1)
专利有效性:
有效专利(1)
法律状态:
授权(1)
高级筛选:

路标网共为您找到相关结果1

公开(公告)时间
申请时间

一种基于决策层融合的音视频关键词识别方法

发明专利有效专利
  • 申请号:CN201410133414.1
  • 申请人:北京大学深圳研究生院
  • 申请日:2014-04-03
  • 主分类号:G10L15/26
  • 公开(公告)日:2014-07-23
  • 公开/公告号:CN103943107A
委托购买

摘要:本发明涉及一种基于决策层融合的音视频关键词识别方法,其主要包括以下步骤:1)录制关键词音视频,得到关键词和非关键词的语音声学特征向量序列和视觉特征向量序列,并据此训练关键词和非关键词的声学模板和视觉模板;2)根据不同声学噪声环境下的音视频,得到声学似然度和视觉似然度,并据此得到声学模态可靠度、视觉模态可靠度和最优权重,并据此训练人工神经网络;3)根据声学模板和视觉模板、人工神经网络,对待测音视频进行并行的基于声学和视觉双模态的二次关键词识别。本发明将声学作用和视觉作用在决策层进行融合,对待测音视频进行并行的基于双模态的二次关键词识别,充分利用声学噪声环境下视觉信息的贡献,提高识别性能。

著录信息权利要求说明书PDF全文法律状态引证文献
  • 1
前往
没找到想要的结果?为您推荐专业专利顾问检索  一种基于决策层融合的音视频关键词识别方法 专利,更快更准确
免费
我想查:已帮助11144724位用户进行查询

*来源于国家知识产权局数据,仅供参考,专利服务由北京酷爱智慧知识产权代理公司提供