加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于参数融合优化决策的音频索引方法

发明专利有效专利
  • 申请号:
    CN201410209057.2
  • IPC分类号:G10L15/08
  • 申请日期:
    2014-05-16
  • 申请人:
    清华大学
著录项信息
专利名称一种基于参数融合优化决策的音频索引方法
申请号CN201410209057.2申请日期2014-05-16
法律状态授权申报国家中国
公开/公告日2014-08-13公开/公告号CN103985381A
优先权暂无优先权号暂无
主分类号G10L15/08IPC分类号G;1;0;L;1;5;/;0;8查看分类表>
申请人清华大学申请人地址
北京市海淀区信箱82分箱清华大学专利办公室 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人清华大学当前权利人清华大学
发明人杨毅;刘加;孙甲松
代理机构西安智大知识产权代理事务所代理人贾玉健
摘要
本发明为一种针对真实场景下的语音数据进行音频索引的方法,将输入的语音信号进行预处理和初始化后进行声学特征提取,然后分别进行基于高斯混合模型的优化学习及量子学习,将高斯混合模型参数与量子学习参数进行融合,最后基于分类决策给出分类结果,本发明中的量子学习方法是将常规类别进行线性叠加来构建量子态,并将量子态作为计算模型的状态。将这种方法扩展为通用分类学习方法,可有效地解决会议场景下多个说话人混合的通用说话人分类问题。

专利服务由北京酷爱智慧知识产权代理公司提供