著录项信息
专利名称 | 基于声纹识别技术的满意度调查作弊排查方法 |
申请号 | CN201310754586.6 | 申请日期 | 2013-12-31 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2014-04-09 | 公开/公告号 | CN103714817A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 厦门天聪智能软件有限公司 | 申请人地址 | 福建省厦门市软件园望海路21号301单元
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 厦门天聪智能软件有限公司 | 当前权利人 | 厦门天聪智能软件有限公司 |
发明人 | 洪青阳;王胜 |
代理机构 | 厦门南强之路专利事务所(普通合伙) | 代理人 | 马应森 |
摘要
基于声纹识别技术的满意度调查作弊排查方法,涉及声纹识别。语音文件预处理;建立模型,将基准语音对应模型与声纹库里的所有模型进行匹配,记录匹配得分最高的前N个语音文件和分数,再进行性别判断;根据经验阈值和性别条件对这N个语音文件进行剔除,得到与基准语音性别一致,匹配得分大于阈值的语音记录,再与基准语音提取出来采用另一种不同声纹识别方法进行确认,核查匹配得分是否大于阈值,若大于则保留;若小于则剔除,经确认核查后的相似组作为最终相似组提交,作为最终的排查结果生成核查认证报告,在报告中会给出基准语音名、所属经销商、与基准语音相似的语音和所属经销商、相似程度得分等,若不存在相似组则说明不存在作弊的情况。
1.基于声纹识别技术的满意度调查作弊排查方法,其特征在于包括以下步骤:
1)语音预处理
将用户满意度调查的语音文件进行建模前的预处理,其中包括录音文件去铃声、静音去除、格式转化、根据经销商提供的语音数据清单将录音文件分配到各自经销商文件夹下过程;
2)声纹识别粗选
(1)将经过预处理的语音文件作为基准语音提取特征,建立模型;
(2)建立模型完成后,将基准语音对应模型与声纹库里的所有模型进行一一匹配,并记录下匹配得分最高的前N个语音文件和分数;
(3)对基准语音中的用户进行性别判断,并记录下该基准语音的性别;
(4)根据经验阈值和性别条件对这N个语音文件进行剔除,得到与基准语音性别一致,匹配得分大于阈值的语音记录;
3)识别结果确认核查
将声纹识别粗选得到的语音记录对应的语音文件和基准语音提取出来核查该条语音与基准语音的匹配得分是否大于阈值,若大于阈值,则该条语音记录保留;若得分小于阈值,则该条语音记录将会被剔除,最终经过确认核查后的相似组作为最终的相似组提交;
4)核查认证报告
经过识别结果确认核查后的相似组作为最终的排查结果生成核查认证报告,在报告中会给出基准语音名,所属经销商,与基准语音相似的语音和所属经销商,相似程度得分情况,若不存在相似组,则说明不存在作弊的情况。
2.如权利要求1所述基于声纹识别技术的满意度调查作弊排查方法,其特征在于在步骤2)第(2)部分中,所述N为100。
基于声纹识别技术的满意度调查作弊排查方法\n技术领域\n[0001] 本发明涉及声纹识别,尤其涉及一种基于声纹识别技术的满意度调查作弊排查方法。\n背景技术\n[0002] 要了解产品的好坏以及经销商的服务质量,需要统计用户对产品和服务质量的满意度。厂商在渠道管理方面的工作之一便是针对经销商的服务,对用户进行满意度调查。考核结果将直接与经销商的利益相关,因为厂商会参考考核分数来决定经销商的返利。而某些发生冲突或不满意用户的调查,会直接影响经销商在用户满意度调查方面的最终得分,所以经销商在给厂商的客户档案里会有意的回避或造假,如提报不及时,提报数量不全,字段内容不完整或填写不规范、联系电话错误或直接被替换等。\n[0003] 目前,核查被替换联系电话的方法多数为数据库核查,核查电话取证等,但随着经销商反核查能力的提升,传统的核查方法面临严峻的挑战,特别是靠人工辨听录音,非常耗时,而且很有可能误判。而声纹识别可以很好解决人工核查成本高、核查周期长、经销商反核查能力提升的问题,真正有效地将经销商找人冒充受访者的实际情况排查出来,巩固客户资料的真实性,以达到“去伪存真”,赏罚分明的目标。\n发明内容\n[0004] 本发明要解决的技术问题是提供一种基于声纹识别技术的满意度调查作弊排查方法,以解决目前排查系统人力成本高、排查周期长、经销商反排查能力提升的缺陷,提高满意度调查的真实性和准确度。\n[0005] 本发明包括以下步骤:\n[0006] 1)语音预处理\n[0007] 将用户满意度调查的语音文件进行建模前的预处理,其中包括录音文件去铃声、静音去除、格式转化、根据经销商提供的语音数据清单将录音文件分配到各自经销商文件夹下等过程;\n[0008] 2)声纹识别粗选\n[0009] (1)将经过预处理的语音文件作为基准语音提取特征,建立模型;\n[0010] (2)建立模型完成后,将基准语音对应模型与声纹库里的所有模型进行一一匹配,并记录下匹配得分最高的前N个语音文件和分数;\n[0011] (3)对基准语音中的用户进行性别判断,并记录下该基准语音的性别;\n[0012] (4)根据经验阈值和性别条件对这N个语音文件进行剔除,得到与基准语音性别一致,匹配得分大于阈值的语音记录;\n[0013] 3)识别结果确认核查\n[0014] 将声纹识别粗选得到的语音记录对应的语音文件和基准语音提取出来采用另一种不同的声纹识别方法进行确认,核查此次过程中该条语音模型与基准语音的匹配得分是否大于阈值,若大于阈值,则该条语音记录保留;若得分小于阈值,则该条语音记录将会被剔除,最终经过确认核查后的相似组作为最终的相似组提交;\n[0015] 4)核查认证报告\n[0016] 经过识别结果确认核查后的相似组作为最终的排查结果生成核查认证报告,在报告中会给出基准语音名,所属经销商,与基准语音相似的语音和所属经销商,相似程度得分等详细情况,若不存在相似组,则说明不存在作弊的情况。\n[0017] 在步骤2第(2)部分中,所述N可为100。\n[0018] 本发明解决目前排查系统人力成本高、排查周期长、经销商反排查能力提升的缺陷,提高满意度调查的真实性和准确度。\n附图说明\n[0019] 图1为基于声纹识别系统的满意度调查作弊排查系统的结构示意图;\n[0020] 图2为系统语音预处理的流程示意图;\n[0021] 图3为系统声纹识别粗选的流程示意图;\n[0022] 图4为系统识别结果确认核查的流程示意图;\n[0023] 图5为系统核查认证报告的流程示意图。\n具体实施方式\n[0024] 为使本发明上述的目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步的详细说明。\n[0025] 本发明的核心思想在于,提供了一种基于声纹识别技术的满意度调查作弊排查方法,包括:语音预处理,用于将满意度调查时的录音文件进行处理,得到便于系统进行识别的语音文件;声纹识别粗选,这是本系统的核心,利用特征提取、建模、模式匹配、性别判断、得分阈值等条件筛选出出声纹模型库中是否存在与基准语音的相似语音;识别结果确认核查,为提高核查的准确性,将相似语音与和基准语音采取另一种不同的声纹识别方法进行确认,此过程中的得分如果大于经验阈值,则该记录保留,如果小于经验阈值,则该记录被剔除;核查认证报告,用于将核查出的作弊情况生成认证报告的过程。本发明能够解决人工核查成本高、核查周期长、经销商反核查能力提升的问题,真正有效的将经销商找人冒充受访者的现实情况排查出来,巩固客户资料的真实性,以达到赏罚分明的目标。\n[0026] 图1表示本发明基于声纹识别系统的满意度调查作弊排查系统的结构示意图,具体包括:\n[0027] 语音预处理S10,用于将满意度调查时的录音文件进行处理,得到便于系统进行识别的语音文件;\n[0028] 声纹识别粗选S20,这是本系统的核心,利用特征提取、建模、模式匹配、性别判断、得分阈值等条件筛选出出声纹模型库中是否存在与基准语音的相似语音;\n[0029] 识别结果确认核查S30,为提高核查的准确性,将相似语音与和基准语音采取另一种不同的声纹识别方法进行确认,此过程中的得分如果大于经验阈值,则该记录保留,如果小于经验阈值,则该记录被剔除;\n[0030] 核查认证报告S40,用于将核查出的作弊情况生成认证报告的过程。\n[0031] 系统在语音处理步骤如图2所示:\n[0032] 步骤S101中,系统对满意度调查语音进行去除铃声处理,排除语音文件中夹杂铃声,电话系统播报声对后续识别效果的影响。\n[0033] 步骤S102中,将S101中去除铃声后的语音文件,转换为系统处理的标准语音文件格式。\n[0034] 步骤S103中,将语音进行去除静音处理,减少无关因素对识别速度的影响。\n[0035] 步骤S104中,将上述处理过的语音文件按照经销商提供的语音清单进行分类,分别将语音文件分配到经销商对应的文件夹中。\n[0036] 系统在声纹识别粗选步骤如图3:\n[0037] 步骤S201中,对基准语音进行特征提取,根据特征建立基准语音的模型。\n[0038] 模型建立后,在步骤S202中,将基准语音模型与声纹库中的模型进行一一匹配,分别得到匹配得分,为处理更加高效,系统保存所有得分从高到低的前N个(例如N为100)。\n[0039] 步骤S203中,根据语音特征,对基准语音进行性别判断,得到基准语音的性别。\n[0040] 步骤S204中,根据步骤S202中的得分和步骤S203中的性别,对得分文件进行剔除,删除点文件中性别与基准语音不一致,匹配得分小于阈值的相似语音记录。\n[0041] 系统在识别结果确认核查步骤如图4:\n[0042] 步骤S301中,提取相似语音和基准语音文件。\n[0043] 步骤S302中,采取不同于声纹识别粗选S20的声纹识别方法对相似语音和基准语音进行相似性确认,得到确认分数。\n[0044] 步骤S303中,判断得到的确认分数是否大于相似性阈值,如果得分大于阈值,则确认与基准语音的相似性,如果得分小于阈值,则认为两者相似程度不高。\n[0045] 步骤S304中,根据步骤S303的判断结果,对步骤S204得到的相似组进行剔除,得到最终的相似组记录。\n[0046] 系统在核查认证报告步骤如图5:\n[0047] 步骤S401中,系统根据经销商提供的语音清单文件,查找基准语音对应的经销商标号,确定该条作弊语音所属的经销商。\n[0048] 步骤S402中,系统根据经销商提供的语音清单文件,查找与基准语音的相似语音所属的经销商编号和得分,确定与基准语音存在作弊情况的经销商。\n[0049] 步骤S403中,生成认证报告,在报告中给出存在满意度调查作弊的经销商标号,作弊语音编号与名称,与该条语音相似的语音编号与名称以及所属经销商标号。\n[0050] 总之,本发明提供了一种基于声纹识别技术的满意度调查和服务质量作弊行为排查系统,以解决目前排查系统人力成本高、排查周期长、经销商反排查能力提升的缺陷,提高满意度调查的真实性和准确度,通过系统的语音预处理,声纹识别粗选,识别结果确认核查,核查认证报告,有效地解决了排查人力成本高、周期长、安全可靠性差的问题,系统不仅具有很强的高效和实用性,同时具有很高的准确性。\n[0051] 本发明不局限与上述实施方式,对于本领域的普通技术人员而言,对上述实施方式所做出的任何显而易见的改进或变更,都应包含在本发明的保护范围内。
法律信息
- 2016-03-23
- 2014-05-07
实质审查的生效
IPC(主分类): G10L 17/02
专利申请号: 201310754586.6
申请日: 2013.12.31
- 2014-04-09
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2006-07-26
|
2006-01-26
| | |
2
| |
2012-10-03
|
2012-05-30
| | |
3
| | 暂无 |
2005-01-25
| | |
4
| |
2011-08-03
|
2011-03-25
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |