一种基于参数融合优化决策的音频索引方法

发明专利有效专利

申请号：
CN201410209057.2
IPC分类号：G10L15/08
申请日期：
2014-05-16
申请人：
清华大学

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	一种基于参数融合优化决策的音频索引方法
申请号	CN201410209057.2	申请日期	2014-05-16
法律状态	授权	申报国家	中国
公开/公告日	2014-08-13	公开/公告号	CN103985381A
优先权	暂无	优先权号	暂无
主分类号	G10L15/08 ? IPC结构图谱： G 物理 G0 仪器 G10 乐器；声学 G10L 语音分析或合成；语音识别；语音或声音处理；语音或音频编码或解码〔4〕 G10L15/00 语音识别（G10L 17/00优先）〔7，2013.01〕 G10L15/08 语音分类或检索〔7〕	IPC分类号	G;1;0;L;1;5;/;0;8查看分类表>
申请人	清华大学	申请人地址	北京市海淀区信箱82分箱清华大学专利办公室变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	清华大学	当前权利人	清华大学
发明人	杨毅;刘加;孙甲松
代理机构	西安智大知识产权代理事务所	代理人	贾玉健

摘要

本发明为一种针对真实场景下的语音数据进行音频索引的方法，将输入的语音信号进行预处理和初始化后进行声学特征提取，然后分别进行基于高斯混合模型的优化学习及量子学习，将高斯混合模型参数与量子学习参数进行融合，最后基于分类决策给出分类结果，本发明中的量子学习方法是将常规类别进行线性叠加来构建量子态，并将量子态作为计算模型的状态。将这种方法扩展为通用分类学习方法，可有效地解决会议场景下多个说话人混合的通用说话人分类问题。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供