著录项信息
专利名称 | 一种病理嗓音细分方法 |
申请号 | CN201210555587.3 | 申请日期 | 2012-12-20 |
法律状态 | 驳回 | 申报国家 | 中国 |
公开/公告日 | 2013-08-21 | 公开/公告号 | CN103258545A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G10L25/66 | IPC分类号 | G;1;0;L;2;5;/;6;6;;; ;A;6;1;B;1;9;/;0;0查看分类表>
|
申请人 | 苏州大学 | 申请人地址 | 江苏省苏州市工业园区仁爱路199号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 苏州大学 | 当前权利人 | 苏州大学 |
发明人 | 陶智; 周强; 张晓俊; 吴迪; 肖仲喆; 季晶晶 |
代理机构 | 南京经纬专利商标代理有限公司 | 代理人 | 曹毅 |
摘要
本发明公开了一种病理嗓音细分方法,包括模型训练模块和识别模块,模型训练模块对输入的噪音信号进行建模、求取对应的似然度,计算匹配概率并比较,找出满足条件的噪音信号,识别模块将满足条件的噪音信号进行匹配。本发明对输入的嗓音信号的长度没有什么要求,可以是任意类型的特征参数,并且不同的特征分配以不同的权值,这样充分利用各参数的优点,且对特征参数的维数没有限制;可以多次训练,针对那些不易被识别的嗓音信号,进行再训练,且训练中阈值、结束的条件和识别中的条件可以灵活设定。本发明可以自行设定病理嗓音的种类,并进行精确细分,实现嗓音疾病的预诊断及患者恢复状况的及时追踪,同时适应于教师、歌手等进行健康自查。
1.一种病理嗓音细分方法,包括模型训练模块和识别模块,其特征在于,所述模型训练模块包括以下步骤:
步骤1)对各类病理嗓音种类,提取各种特征参数;
步骤2)每类嗓音每种特征参数进行GMM训练,得到训练的GMM矩阵;
步骤3)将步骤1)提取的特征参数输入训练好的GMM,求取对应的似然度;
步骤4)根据步骤3)算出的似然度,计算各类病理嗓音的匹配概率;
步骤5)对步骤4)求出的各特征参数匹配概率加权求和得总匹配度Match;
步骤6)对步骤5)求得的Match和阈值进行比较,当大于阈值时,则进行各特征的贡献率计算;当小于阈值时,则进行计数及送入结束判断;
步骤7)根据步骤6)算出的各特征的贡献率进行权重分配,其中各特征权重之和为1;
步骤8)对步骤5)中的Match小于阈值且不满足结束条件的嗓音信号返回步骤1);嗓音信号满足结束条件时,则训练结束;
所述识别模块包括以下步骤:
步骤9)将步骤8)中满足结束条件的嗓音信号进行特征提取;
步骤10)载入训练好的识别模型;
步骤11)将步骤9)中提取的特征和对应的加载模型进行匹配;
步骤12)匹配结果如果满足设定的条件,则识别结束;如果不满足则载入下一个训练好的模型,并转入步骤11)。
一种病理嗓音细分方法\n技术领域\n[0001] 本发明属于噪音领域,具体涉及一种病理嗓音细分方法。\n背景技术\n[0002] 对嗓音状况的调查表明,我国至少1亿人患有各种嗓音疾病,涉及到生理和工作环境等许多原因。主要是因发声言语器官的功能性或器质性损害而导致的发声言语功能障碍。早期对于病理嗓音的检测主要是医学专家进行主观的判别,其误判率较大。电子仪器诊查方法的缺点是,肉眼很难捕捉发音瞬间,且会给病人带来不便,导致不准确的诊断结果。随着模式识别的提出,方便且无侵害的自动检测法成为研究重点。\n[0003] 随着病理嗓音自动识别的提出,很多特征参数相继出现。大致可以分为四大类:\n步骤)时域及其统计学参数,如基频、频率微扰、幅度扰动等;步骤)变换域类参数,如LPCC、MFCC等;(3)噪声参数,如谐噪比、声门噪声能量等;(4)非线性特性参数,如最大李雅普诺夫指数、关联维等。由于病理嗓音的种类较多,各个参数对于病理嗓音的细分都产生了不同程度的影响。\n[0004] 一般的识别方法分为训练部分和识别部分。建模首先要提取嗓音信号的特征,然后训练得到模型。识别部分首先进行特征提取,然后和训练好的模型进行匹配得到匹配得分,再和设定的阈值比较,最后得到判别结果。目前方法都存在两个问题,一是并没有进行病理嗓音的精确细分,只是进行了是与非的判别;二是并没有充分利用各特征的优势,特别是没有考虑到特征之间的互补性。\n[0005] \n发明内容\n[0006] 为解决上述问题,本发明的目的是提供一种病理嗓音细分方法,充分利用各类参数的优势,并实现了病理嗓音的细分。\n[0007] 样处理厂的告知系统为实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:\n一种病理嗓音细分方法,包括模型训练模块和识别模块,所述模型训练模块包括以下步骤:\n步骤1)对各类病理嗓音种类,提取各种特征参数;\n步骤2)每类嗓音每种特征参数进行GMM训练,得到训练的GMM矩阵;\n步骤3)将步骤1)提取的特征参数输入训练好的GMM,求取对应的似然度;\n步骤4)根据步骤3)算出的似然度,计算各类病理嗓音的匹配概率;\n步骤5)对步骤4)求出的各特征参数匹配概率加权求和得总匹配度Match;\n步骤6)对步骤5)求得的Match和阈值进行比较,当大于阈值时,则进行各特征的贡献率计算;当小于阈值时,则进行计数及送入结束判断;\n步骤7)根据步骤6)算出的各特征的贡献率进行权重分配,其中各特征权重之和为1;\n步骤8)对步骤5)中的Match小于阈值且不满足结束条件的嗓音信号返回步骤1);嗓音信号满足结束条件时,则训练结束;\n所述识别模块包括以下步骤:\n步骤9)将步骤8)中满足结束条件的嗓音信号进行特征提取;\n步骤10)载入训练好的识别模型;\n步骤11)将步骤9)中提取的特征和对应的加载模型进行匹配;\n步骤12)匹配结果如果满足设定的条件,则识别结束;如果不满足则载入下一个训练好的模型,并转入步骤11)。 \n本发明的有益效果是:\n1、本发明对输入的嗓音信号的长度没有什么要求,可以是任意类型的特征参数,并且不同的特征分配以不同的权值,这样充分利用各参数的优点,且对特征参数的维数没有限制;\n2、本发明可以多次训练,针对那些不易被识别的嗓音信号,进行再训练,且训练中阈值、结束的条件和识别中的条件可以灵活设定;\n3、本发明可以自行设定病理嗓音的种类,并进行精确细分,实现嗓音疾病的预诊断及患者恢复状况的及时追踪,同时适应于教师、歌手等进行健康自查。\n[0008] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,并可依照说明书的内容予以实施,以下以本发明的较佳实施例并配合附图详细说明如后。\n本发明的具体实施方式由以下实施例及其附图详细给出。\n附图说明\n[0009] 图1为本发明的建模流程图;\n图2为本发明的匹配与筛选工作流程图;\n图3为本发明的识别模块的工作流程图;\n图4为本发明的识别模块的另一种工作流程图。\n具体实施方式\n[0010] 下面将参考附图并结合实施例,来详细说明本发明。\n[0011] 参见图1、图2所示,一种病理嗓音细分方法,包括模型训练模块和识别模块,所述模型训练模块包括以下步骤:\n步骤1)对N类病理嗓音的每个嗓音提取M种特征参数;\n步骤2)然后根据步骤1)中的特征参数进行GMM训练,每类嗓音每种特征得到一个训练好的模型,所以为N*M个GMM;\n步骤3)接着对嗓音信号的特征输入对应特征的GMM并求取似然度;\n步骤4)根据步骤3)求取的似然度,求取嗓音对应与每类嗓音的概率;\n步骤5)每种特征对应的概率加权求和用以表征对应于嗓音信号种类的匹配程度Match;\n步骤6)对步骤5)求得的Match和阈值进行比较,如果大于阈值,将进行各特征的贡献率计算,用来调节概率的加权系数;如果小于阈值,将进行计数及送入结束判断;\n步骤7)对步骤6)中送入结束判断的嗓音如果不满足结束条件,则送回步骤2)重新进行GMM训练,否则训练结束。这样就得到了训练好的嗓音信号。\n[0012] 识别模块实施例一:\n参见图3所示,识别模块包括以下步骤:\n步骤8)提取输入嗓音信号的M中特征参数;\n步骤9)加载训练好的GMM矩阵;\n步骤10)将步骤8)中提取的特征参数,输入训练好的GMM矩阵,得到每种特征对应每类嗓音的似然度;\n步骤11)根据步骤10)求出的似然度,求取为每类病理嗓音的概率;\n步骤12)向概率最大所对应的病理嗓音种类投票,每种特征都会有一票;\n步骤13)所有特征综合起来,进行总计票;如果是最后一个模型,则待识别嗓音为总票数最多所对应的病理嗓音种类,结束;如果不是最后一个模型,总票数大于设定的阈值,则待识别嗓音为总票数最多所对应的病理嗓音种类,结束,小于阈值的则载入下一个GMM矩阵并转入步骤10)。\n[0013] 识别模块实施例二:\n参见图4所示,识别模块包括以下步骤:\n步骤8)提取输入嗓音信号的M中特征参数;\n步骤9)加载训练好的GMM矩阵;\n步骤10)将步骤8)中提取的特征参数,输入训练好的GMM矩阵,得到每种特征对应每类嗓音的似然度;\n步骤11)根据步骤10)求出的似然度,求取嗓音为每类病理嗓音的概率;\n步骤12)所有特征对应的概率加权求和,作为总匹配Match;\n步骤13)在所有病理嗓音种类匹配Match中选取最大的Match;如果是最后一个模型,则待识别嗓音为最大的Match所对应的病理嗓音种类,结束;如果不是,Match大于设定的阈值,则待识别嗓音为最大的Match所对应的病理嗓音种类,结束,小于阈值的则载入下一个GMM矩阵并转入步骤10)。\n[0014] 以上所述仅为发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
法律信息
- 2016-06-01
发明专利申请公布后的驳回
IPC(主分类): G10L 25/66
专利申请号: 201210555587.3
申请公布日: 2013.08.21
- 2013-09-18
实质审查的生效
IPC(主分类): G10L 25/66
专利申请号: 201210555587.3
申请日: 2012.12.20
- 2013-08-21
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2009-06-10
|
2007-11-29
| | |
2
| |
1989-10-04
|
1988-10-05
| | |
3
| |
2006-12-13
|
2006-05-15
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2013-12-20 | 2013-12-20 | | |