路标网共为您找到相关结果1个
一种基于决策层融合的音视频关键词识别方法
发明专利有效专利摘要:本发明涉及一种基于决策层融合的音视频关键词识别方法,其主要包括以下步骤:1)录制关键词音视频,得到关键词和非关键词的语音声学特征向量序列和视觉特征向量序列,并据此训练关键词和非关键词的声学模板和视觉模板;2)根据不同声学噪声环境下的音视频,得到声学似然度和视觉似然度,并据此得到声学模态可靠度、视觉模态可靠度和最优权重,并据此训练人工神经网络;3)根据声学模板和视觉模板、人工神经网络,对待测音视频进行并行的基于声学和视觉双模态的二次关键词识别。本发明将声学作用和视觉作用在决策层进行融合,对待测音视频进行并行的基于双模态的二次关键词识别,充分利用声学噪声环境下视觉信息的贡献,提高识别性能。
*来源于国家知识产权局数据,仅供参考,专利服务由北京酷爱智慧知识产权代理公司提供