著录项信息
专利名称 | 一种基于声纹识别和定位跟踪的交叉监控方法和系统 |
申请号 | CN200910196988.2 | 申请日期 | 2009-10-10 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2010-03-17 | 公开/公告号 | CN101673544 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G10L17/00 | IPC分类号 | G;1;0;L;1;7;/;0;0;;;G;0;1;S;5;/;0;2;;;H;0;4;M;3;/;4;2查看分类表>
|
申请人 | 上海电虹软件有限公司;熊电元 | 申请人地址 | 上海市闵行区金都路4299号D幢967号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 上海电虹软件有限公司,熊电元 | 当前权利人 | 上海电虹软件有限公司,熊电元 |
发明人 | 熊电元 |
代理机构 | 上海三和万国知识产权代理事务所 | 代理人 | 蔡海淳 |
摘要
一种基于声纹识别和定位跟踪的交叉监控方法和系统,属监测系统领域。其对被监管对象采集个人信息和语音样本并构建其声纹模型,而后通过无线定位通信终端采集其定位信息和声纹信息,与数据库中的存档信息进行比对,输出一个反映被监管对象的人体活动轨迹和实际违规状况的完整报告,供其监管工作人员考察和评估被监管对象的业绩表现;监管工作人员可不定期地要求和评估关于被监管对象活动表现的统计分析报告,观察其活动轨迹和状态或依据其业绩表现调整其监管方案。其实现了对被监管对象的远程定位跟踪,实现了对被监管对象的非接触式生物身份识别,满足了远距离、非接触式地监控被监管对象的需要。可广泛用于非接触式电子监控和身份识别领域。
1.一种基于声纹识别和定位跟踪的交叉监控方法,其特征是,所述的交叉监控方法至少包括以下步骤:
A、针对被监管对象,采集其个人信息,注册其用户标识和个人信息,采集其注册语音样本并构建其声纹模型,指定其个人专用的定位通信终端,设置其监管方案,设定其违规报警方案;所述定位通信终端的网络身份ID具有唯一性,将所述网络身份ID与所述被监管对象的用户标识一一对应地绑定;
B、针对所述定位通信终端,反复地自动执行定位监控步骤,分析和存储每次定位监控的结果;
C、针对被监管对象,反复地自动执行以声纹识别为核心的语音监控步骤,分析和存储每次语音监控的结果;
D、针对所述被监管对象及其指定使用的定位通信终端,临时被要求或周期性自动地交叉统计和分析在同一统计时间段内发生的定位监控和语音监控各自产生的结果记录,最终给出一个反映了所述被监管对象的人体活动轨迹和实际违规状况的完整报告,供其监管工作人员考察和评估所述被监管对象的业绩表现;
E、监管工作人员不定期地要求调阅和评估关于被监管对象业绩表现的统计分析报告,观察其活动轨迹和状态或依据其业绩表现调整其监管方案。
2.按照权利要求1所述的基于声纹识别和定位跟踪的交叉监控方法,其特征是所述的监管方案包括以下部分或者全部信息项:所述定位监控步骤反复发生的时间与频率、监控系统主动请求还是被动接收定位信息、被监管对象的活动区域限制、所述语音监控步骤反复发生的时间与频率、被监管对象主动发起语音呼叫还是被动接受语音呼叫、系统语音提示-用户语音应答的要求方式与内容选择、交叉统计和分析监控结果的时间周期;所述的违规报警方案至少包括启动报警的条件、发送报警的方式和接收报警的对象;如果个性化的监管和违规报警方案未被设置,则系统缺省的方案设置被采用。
3.按照权利要求1所述的基于声纹识别和定位跟踪的交叉监控方法,其特征是所述的定位监控步骤和语音监控步骤,按照被监管对象的监管和违规报警方案的不同,分别独立地或并行地被执行。
4.按照权利要求1所述的基于声纹识别和定位跟踪的交叉监控方法,其特征是所述的定位监控步骤进一步包括,利用定位技术方法,远程地获取定位通信终端的网络身份ID和地理位置,以及定位发生的时间;根据所述网络身份ID与用户标识之间的绑定关系,查询所述网络身份ID所唯一绑定的被监管对象的用户标识和活动区域限制;判断所获取的地理位置是否违规超越了被监管对象的活动区域限制,如果这次发生违规,触发了报警条件,那么使用指定的报警方式向指定的接收报警的对象发送报警消息;将此次定位监控的结果与所述用户标识对应关联地存储;
其中,所述定位监控的结果至少包括网络身份ID、地理位置、定位发生时间和违规越界状态;
所述的定位技术是卫星定位、无线移动通信网络基站定位或卫星与无线移动通信网络基站的混合定位,其所述的定位技术通过定位通信终端和/或无线移动通信网络服务来实现。
5.按照权利要求1所述的基于声纹识别和定位跟踪的交叉监控方法,其特征是所述的语音监控步骤进一步包括,建立人机交互语音对话,获取被监管对象所持有的定位通信终端的网络身份ID,远程实时地录取被监管对象根据播放的随机语音提示或要求所输入的应答语音;对所录取的应答语音开展声纹识别,验证所述被监管对象的生物身份;为了验证真人在场说话,选择性地增加针对应答语音的内容识别步骤,即鉴定所述应答语音的内容是否切合匹配实际播放的语音提示或要求;综合利用所述网络身份ID、声纹识别结果和/或应答内容的鉴定结果,判断所述被监管对象是否现场持有其指定使用的定位通信终端,设定违规状态;如果发生违规并触发了报警条件,则使用指定的报警方式向指定的接收报警的对象发送报警消息;将此次语音监控的结果与所述被监管对象的用户标识对应关联地存储;
其中,所述语音监控的结果包括网络身份ID、声纹识别结果和/或语音内容鉴定结果、违规状态和监控的发生时间。
6.按照权利要求4或5所述的基于声纹识别和定位跟踪的交叉监控方法,其特征是在所述的定位监控步骤和语音监控步骤中,所述报警消息的发送步骤与所述定位监控或语音监控的结果的存储步骤之间的先后执行次序无关。
7.按照权利要求1或5所述的基于声纹识别和定位跟踪的交叉监控方法,其特征是所述的声纹识别分为声纹注册和声纹验证两个阶段;
其中,所述的声纹注册阶段至少包括:
声纹特征提取步骤,用于对用户语音做数字信号处理,并从处理结果中提取表征其发音生理和行为特点的声纹特征序列;
声纹模型建立步骤,用于根据从用户注册语音中提取出的声纹特征序列建立表征用户本人发音特点的声纹模型;
其中,所述的声纹验证阶段至少包括:
声纹特征提取步骤,用于对用户语音做数字信号处理,并从处理结果中提取表征其发音生理和行为特点的声纹特征序列;
声纹模式匹配步骤,用于根据从用户验证语音中提取出的声纹特征序列与对应的用户声纹模型进行比对,从而确认所述用户的身份。
8.一种按照权利要求1所述方法工作的基于声纹识别和定位跟踪的交叉监控系统,其中,被监管对象接受来自该交叉监控系统的自动监控和来自监管工作人员的管理;监管工作人员操作该交叉监控系统,管理被监管对象;其特征是该系统包括:
一定位通信终端,作为一种个人便携式硬件装置被附着在被监管对象的身体表面或者由被监管对象近距离所持有;
一应用服务器,用于提供至少以下服务功能:语音通信、数据通信、系统管理、声纹认证和信息存储;
一监管操作终端,作为客户端,与所述的应用服务器形成Browser/Server或Client/Server的服务架构;监管工作人员通过该监管操作终端管理被监管对象的个人信息、设定监管方案、设定报警条件、指定报警方式和对象、发布消息通知与命令、接收报警通知、观察被监管对象的地理位置和活动轨迹和查阅被监管对象的统计分析报告;
所述的定位通信终端与应用服务器之间,通过第一通信网络连接,
所述的第一通信网络用于传输和协调涉及被监管对象的语音通信和数据通信;
所述的监管操作终端与应用服务器之间,通过第二通信网络连接,
所述的第二通信网络用于传输和转送涉及监管工作人员的数据通信和语音通信。
9.按照权利要求8所述的基于声纹识别和定位跟踪的交叉监控系统,其特征是所述的定位通信终端具有唯一的网络身份ID;用于数据通信,接收/发送定位信号,参与系统定位;还用于语音通信,在人机交互语音对话过程中播放系统的随机语音提示或要求,采集和传输被监管对象输入的应答语音;
所述的应用服务器,由单台计算机所代表的实体性服务器或由彼此之间通过网络连接协调工作的多台计算机共同组成的虚拟性服务器所构成,其包括一个或多个服务子系统,还用于选择性地提供语音内容识别、文字语音合成和地理信息服务的可选的辅助服务功能;若所述应用服务器是由多台计算机所构成的虚拟性服务器,则所述的多台计算机被集中部署在同一个局域网或被分散部署在地理分布不同的区域网点,而且所述计算机是由网络连接并被系统管理服务所协调与控制;
所述的应用服务器通过系统管理与信息存储服务功能,根据用户标识与定位通信终端的网络身份ID之间的绑定关系,交叉统计和分析同一统计时间段内发生的定位监控和语音监控的结果,为监管工作人员提供关于被监管对象的人体活动轨迹和实际违规状况的报告;
所述的第一通信网络,参与执行所述的定位监控和语音监控;
所述的第二通信网络,参与执行系统的操控与管理、显示被监管对象的地理位置、活动轨迹、违规状况和统计分析报告。
10.按照权利要求9所述的基于声纹识别和定位跟踪的交叉监控系统,其特征是所述的人机交互语音对话过程至少涉及被监管对象、定位通信终端以及应用服务器;其允许以主动呼叫和被动接听两种方式来启动语音通信;
其所述的主动呼叫方式是由被监管对象通过其持有的定位通信终端主动呼叫应用服务器,所述应用服务器接受该主动呼叫,并探测识别所述定位通信终端的网络身份ID;
其所述的被动接听方式是由应用服务器先选择作为监控目标的被监管对象,查询与被监管对象绑定的定位通信终端的网络身份ID,应用服务器根据所查询的网络身份ID,主动外呼具有该网络身份ID的定位通信终端,由持有该定位通信终端的被监管对象接听电话呼叫。
一种基于声纹识别和定位跟踪的交叉监控方法和系统\n技术领域\n[0001] 本发明属于监测系统领域,尤其涉及一种同时采用生物识别技术和电子定位方法对被监管对象进行识别和定位的交叉监控方法和系统。\n背景技术\n[0002] 相对于监狱矫正,社区矫正不仅可以降低行刑成本,减轻国家在刑罚上的投入,避免监狱内人满为患,防止监狱内的交叉感染,还有助于罪犯的改造和回归社会。\n[0003] 经过长期的实践,社区矫正作为一种经济而又有效的犯人改造和教养方式,在西方主要发达国家得到了广泛的发展。根据国外的发展经验,我们国家也已经在多个省市区开始了社区矫正的试点,并计划于近期在全国全面推开社区矫正工作。\n[0004] 很多国家将部分危害风险低的犯人(包括缓刑、轻罪、假释等犯人)推向社会,实行社区矫正改造,由此带来了如何有效监管的技术问题。\n[0005] 类似地,对于企业移动工作队伍和业务人员也一直存在如何有效监管和跟踪的技术问题,比如:企业销售业务人员、野外巡视人员、物流配送人员、连锁经营企业的巡检人员和医疗看护人员等。\n[0006] 随着现代通信技术和定位技术的快速发展,特别是无线移动通信和全球卫星定位的日益普及,对具有定位和通信功能的装置开展远程定位跟踪变得越来越方便,定位监控系统的成本越来越低,这吸引了大量企业和政府组织对这种远程定位监控技术产生了浓厚的兴趣。\n[0007] 目前,主流的远程定位技术主要采用包括移动通信基站定位、卫星定位、卫星与移动通信基站混合定位等方法。\n[0008] 然而,无论采用上述哪种定位技术方法,现阶段在技术上还很难做到将具有远程定位和移动通信功能的个人便携式终端装置(比如:手机/移动通信电话或者卫星定位信号接收装置等)嵌入到被监管对象的身体内部,因而用于定位监控的定位通信终端装置物往往只能被附着在被监管对象的身体表面或者由被监管对象近距离地持有。\n[0009] 由于这种定位通信装置物,可能有意或者无意地被脱落或丢弃,造成人机分离/“金蝉脱壳”的状况,使得被监管对象随时可以逃脱定位监控;现有的定位监控方法或系统本质上只能定位跟踪用于定位通信的装置物,而无法直接定位跟踪被监管对象的人体本身;只有通过人为假设,认为被监管对象总是现场持有该定位通信装置物,才能把所述定位通信装置物的移动轨迹当作所述被监管对象的人体活动轨迹。\n[0010] 因此,现有的定位监控方法或系统普遍存在一个“只认物、不认人”的重大缺陷。\n发明内容\n[0011] 本发明所要解决的技术问题是提供一种基于声纹识别和定位跟踪的交叉监控方法和系统,其可实现对被监管对象人体的远程定位跟踪,除了可以对被监管对象进行定位监测,还可以实现对被监管对象的非接触式生物身份识别,克服了现有定位监控方法或系统“只认物、不认人”的重大缺陷,满足了远距离、非接触式地监控被监管对象的需要。\n[0012] 本发明的技术方案是:提供一种基于声纹识别和定位跟踪的交叉监控方法,其特征是,所述的交叉监控方法至少包括以下步骤:\n[0013] A、针对被监管对象,采集其个人信息,注册其用户标识和个人信息,采集其注册语音样本并构建其声纹模型,指定其个人专用的定位通信终端,设置其监管方案,设定其违规报警方案;所述定位通信终端的网络身份ID具有唯一性,将所述网络身份ID与所述被监管对象的用户标识一一对应地绑定;\n[0014] B、针对所述定位通信终端,反复地自动执行定位监控步骤,分析和存储每次定位监控的结果;\n[0015] C、针对被监管对象,反复地自动执行以声纹识别为核心的语音监控步骤,分析和存储每次语音监控的结果;\n[0016] D、针对所述被监管对象及其指定使用的定位通信终端,临时被要求或周期性自动地交叉统计和分析在同一统计时间段内发生的定位监控和语音监控各自产生的结果记录,最终给出一个反映了所述被监管对象的人体活动轨迹和实际违规状况的完整报告,供其监管工作人员考察和评估所述被监管对象的业绩表现;\n[0017] E、监管工作人员不定期地要求和评估关于被监管对象活动表现的统计分析报告,观察其活动轨迹和状态或依据其业绩表现调整其监管方案。\n[0018] 其中,上述的监管方案包括以下部分或者全部信息项:所述定位监控步骤反复发生的时间与频率、监控系统主动请求还是被动接收定位信息、被监管对象的活动区域限制,所述语音监控步骤反复发生的时间与频率、被监管对象主动发起语音呼叫还是被动接受语音呼叫、系统语音提示-用户语音应答的要求方式与内容选择、交叉统计和分析监控结果的时间周期;所述的违规报警方案至少包括启动报警的条件、发送报警的方式和/或接收报警的对象。\n[0019] 如果个性化的监管和报警方案未被设置,则系统缺省的方案设置被采用。\n[0020] 进一步的,其所述的定位监控步骤和语音监控步骤,按照被监管对象的监管和/或报警方案的不同,可以分别独立地和/或并行地被执行。\n[0021] 具体的,上述的定位监控步骤至少包括:利用定位技术方法,远程地获取定位通信终端的网络身份ID和地理位置,以及定位发生的时间;根据所述网络身份ID与用户标识之间的绑定关系,查询所述网络身份ID所唯一绑定的被监管对象的用户标识和活动区域限制;判断所获取的地理位置是否违规超越了被监管对象的活动区域限制,如果这次违规触发了报警条件,那么使用指定的报警方式向指定的报警对象发送报警消息;将此次定位监控的结果与所述用户标识对应关联地存储;\n[0022] 其中,所述定位监控的结果可以包括网络身份ID、地理位置、定位发生时间与违规越界状态;\n[0023] 其所述的定位技术可以是卫星定位、无线移动通信网络基站定位或卫星与无线移动通信网络基站的混合定位,其所述的定位技术通过定位通信终端和/或无线移动通信网络服务来实现。\n[0024] 具体的,上述的语音监控步骤至少包括:建立人机交互语音对话,获取被监管对象所持有的定位通信终端的网络身份ID,远程实时地录取被监管对象根据播放的随机语音提示或要求所输入的应答语音;对所录取的应答语音开展声纹识别,验证所述被监控对象的生物身份;为了验证真人在场说话,可以选择性地增加针对应答语音的内容识别步骤,即鉴定所述应答语音的内容是否切合匹配实际播放的语音提示或要求;综合利用所述网络身份ID、声纹识别结果和/或应答内容的鉴定结果,判断所述被监管对象是否现场持有其指定使用的定位通信终端,设定违规状态;如果发生违规并触发了报警条件,则使用指定的报警方式向指定的报警对象发送报警消息;将此次语音监控的结果与所述被监管对象的用户标识对应关联地存储;\n[0025] 其中,所述语音监控的结果可以包括网络身份ID、声纹识别结果和/或语音内容鉴定结果、违规状态或监控的发生时间。\n[0026] 在所述的定位监控和语音监控步骤中,所述违规报警的发送步骤与所述监控结果的存储步骤之间的先后执行次序无关。\n[0027] 具体的,上述的声纹识别可以分为声纹注册和声纹验证两种阶段;\n[0028] 其中,所述的声纹注册阶段至少包括声纹特征提取步骤,用于对用户语音做数字信号处理,并从该语音处理结果中提取可表征其发音生理和行为特点的声纹特征序列;\n[0029] 其所述的声纹模型建立步骤,用于根据从用户注册语音中提取出的声纹特征序列建立表征用户本人发音特点的声纹模型;\n[0030] 其中,所述的声纹验证阶段至少包括声纹特征提取步骤,用于对用户语音做数字信号处理,并从该语音处理结果中提取可表征其发音生理和行为特点的声纹特征序列;\n[0031] 其所述的声纹模式匹配步骤,用于根据从用户验证语音中提取出的声纹特征序列与对应的用户声纹模型进行比对,从而确认所述用户的身份。\n[0032] 本发明还提供了一种按照上述方法进行工作的基于声纹识别和定位跟踪的交叉监控系统,包括被监管对象和监管工作人员,其中,被监管对象接受来自监控系统的自动监控和来自监管工作人员的管理;监管工作人员操作监控系统,管理被监管对象;其特征是:\n[0033] 设置一定位通信终端,作为一种个人便携式硬件装置被附着在被监管对象的身体表面或者由被监管对象近距离所持有;\n[0034] 设置一应用服务器,用于提供至少以下服务功能:语音通信、数据通信、系统管理、声纹认证和/或信息存储;\n[0035] 设置一监管操作终端,作为客户端,与所述的应用服务器形成Browser/Server或Client/Server的服务架构;监管工作人员可以通过它管理被监管对象的个人信息、设定监管方案、设定报警条件、指定报警方式和对象、发布消息通知与命令、接收报警通知、观察被监管对象的地理位置和活动轨迹或查阅被监管对象的统计分析报告;\n[0036] 所述的定位通信终端与应用服务器之间,通过第一联接网络连接,[0037] 所述的第一通信网络用于传输和协调那些涉及被监管对象的语音通信和数据通信;\n[0038] 所述的监管操作终端与应用服务器之间,通过第二联接网络连接,[0039] 所述的第二通信网络用于传输和转送那些涉及监管工作人员的数据通信和/或语音通信。\n[0040] 具体的,其所述的定位通信终端具有唯一的网络身份ID;用于数据通信,接收/发送定位信号,参与系统定位;还可用于语音通信,在人机交互语音对话过程中播放系统的随机语音提示或要求,采集和传输被监管对象输入的应答语音;\n[0041] 其所述的应用服务器,由单台计算机所代表的实体性服务器或由彼此之间通过网络连接协调工作的多台计算机共同组成的虚拟性服务器所构成,其可以包括一个或多个服务子系统,还可以用于选择性地提供语音内容识别、文字语音合成和地理信息服务等可选的辅助服务功能;若所述应用服务器是由多台计算机所构成的虚拟性服务器,则所述的多台计算机可以被集中部署在同一个局域网,也可以被分散部署在地理分布不同的区域网点,而且所述计算机是由网络连接并被系统管理服务所协调与控制;\n[0042] 其所述的应用服务器通过系统管理与信息存储服务功能,根据用户标识与定位通信终端的网络身份ID之间的绑定关系,交叉统计和分析同一统计时间段内发生的定位监控和语音监控的结果,为监管工作人员提供关于被监管对象的人体活动轨迹和违规表现状况报告;\n[0043] 其所述的第一通信网络,参与执行所述的定位监控和/或语音监控;\n[0044] 其所述的第二通信网络,参与执行所述的系统操控与管理、显示被监管对象的地理位置、活动轨迹、违规状况和/或统计分析报告。\n[0045] 进一步的,上述的人机交互语音对话至少涉及被监管对象、定位通信终端以及应用服务器;其允许以主动呼叫和被动接听两种方式来启动语音通信;\n[0046] 其主动呼叫方式是由被监管对象通过其持有的定位通信终端主动呼叫应用服务器,所述应用服务器接受该语音呼叫,并探测识别所述定位通信终端的网络身份ID;\n[0047] 其被动接听方式是由应用服务器先选择作为监控目标的被监管对象,查询与被监管对象绑定的定位通信终端的网络身份ID,应用服务器根据所查询的网络身份ID,主动外呼具有该网络身份ID的定位通信终端,由持有该定位通信终端的被监管对象接听电话呼叫。\n[0048] 与现有技术比较,本发明的优点是:\n[0049] 1.采用声纹认证和定位跟踪的双重电子监控方法和系统,除了可以对被监管对象进行定位监测,还可以实现对被监管对象的非接触式生物身份识别,克服了现有监测方法或系统“只认物、不认人”的不足,满足了远距离、非接触式监控被监管对象的需要;\n[0050] 2.不仅对被监管对象的空间活动状况进行定位跟踪,并且通过以声纹识别为核心的语音监控方式,按预定计划或者随机地查验被监管对象是否与现场持有其预先指定使用的定位通信终端装置物,从而有效地阻止被监管对象长时间地采取人体与定位通信终端装置物远距离地分离的方式逃脱电子监控;而且在语音监控方面,系统随机地外呼用户开展声纹认证可以比用户主动呼入系统做声纹认证,更加有效地杜绝“人机分离”的违规现象;\n[0051] 3.在真正意义上实现了对被监管对象人体的远程定位跟踪,可以帮助监管机构实现对地理分布不同的大规模用户进行自动化监控与管理,从而大大地减轻监管工作人员的工作负担,提高监管的有效率性和可靠性,在针对移动工作队伍和社区矫正犯人等的电子监控方面具有特别重要的应用。\n附图说明\n[0052] 图1是本发明监控系统的结构示意图;\n[0053] 图2是本发明实施例中应用服务器的声纹认证服务子系统的结构示意图;\n[0054] 图3是本发明交叉监控方法的工作流程方框图;\n[0055] 图4是本发明定位监控的工作流程方框图;\n[0056] 图5是本发明语音监控的工作流程方框图。\n具体实施方式\n[0057] 本发明的核心思想是:建立人机交互语音对话,远程、实时地录取被监管对象的应答语音,对所录取的应答语音开展声纹识别和/或内容识别,验证所述被监管对象的生物身份,并判断其是否现场持有指定使用的定位通信终端;通过定位跟踪方法,远程获取所述被监管对象指定使用的定位通信终端的地理位置,并记录所述定位通信终端的移动轨迹;\n交叉统计和分析定位跟踪和声纹认证的结果,可以有效可靠地获得所述被监管对象的人体活动轨迹和违规状况;关键是以声纹识别为核心的语音监控可以有效地阻止被监管对象采用“人机分离”的方式逃脱电子监控,所以上述定位通信终端的地理位置和移动轨迹可以被可靠地认为是被监管对象人体的位置和活动轨迹。\n[0058] 下面结合附图和实施例对本发明做进一步说明。\n[0059] 在图1中,本发明的交叉监控系统1至少由应用服务器10、定位通信终端20、监管操作终端30、被监管对象40和监管工作人员50组成,其中应用服务器10包括数据通信服务子系统101、语音通信服务子系统102、系统管理服务子系统103、信息存储服务子系统\n104、声纹认证服务子系统105、语音内容识别服务子系统106、地理信息服务子系统107以及子系统之间的互连接口108。\n[0060] 其定位通信终端与应用服务器之间,通过第一通信网络11连接。\n[0061] 其监管操作终端与应用服务器之间,通过第二通信网络12连接。\n[0062] 其中,定位通信终端,具有唯一的网络身份ID(例如,移动电话号码),在单个硬件装置里集成了定位功能模块和数据/语音通信功能模块,被附着在被监管对象的身体表面或者被其近距离所持有,再结合无线通信网络与服务一起,用于获取所述定位通信终端的位置信息、实现数据通信和语音通话等。\n[0063] 应用服务器,被集中或分散部署在数据与语音通信网络上,其可以是由单台计算机所代表的实体性服务器,也可以是由彼此之间通过网络连接协调工作的多台计算机共同组成的虚拟性服务器(如:由多台计算机联网组成的集中式或者分布式机群),用于提供了六项服务功能:数据通信、语音通信、系统管理、信息存储、声纹认证、语音内容识别、以及地理信息服务。在实际应用中,如果需要更灵活的动态语音播报,还可以选择集成另外的文字语音合成服务功能。\n[0064] 监管操作终端,作为客户端,与所述应用服务器形成Browser/Server或者Client/Server的服务架构;通过它,监管工作人员可以管理被监管对象的个人信息、设定监管方案、设定报警条件、指定报警方式和对象、发布消息通知与命令、接收报警通知、观察被监管对象的地理位置和活动轨迹、查阅被监管对象的统计分析报告、依据其业绩表现可能调整其监管方案等。\n[0065] 其第一通信网络用于传输和协调那些涉及被监管对象的语音通信和数据通信,参与执行所述的定位监控和/或语音监控。\n[0066] 其第二通信网络用于传输和转送那些涉及监管工作人员的数据通信和/或语音通信,参与执行所述的系统操控与管理、显示被监管对象的地理位置、活动轨迹、违规状况和/或统计分析报告。\n[0067] 第一通信网络可以为无线通信/电话网络,第二通信网络可以为有线或无线形式的广域网或局域网网络。\n[0068] 具体地说,\n[0069] 定位监控的实现过程可以包括:定位通信终端和/或无线移动通信网络服务参与获取所述定位通信终端的定位信息和网络身份ID,无线移动通信网络传送定位信息和网络身份ID,数据通信服务子系统接收定位信息和网络身份ID,从定位信息中分析得出地理位置信息,查询所述网络身份ID所绑定的用户标识所代表的被监管对象的活动区域限制,通过比较所述地理位置和活动区域限制决定违规越界状态,把定位监控的结果交给信息存储服务子系统保存,若发生违规越界则发送报警。\n[0070] 语音监控的实现过程可以包括:通过定位通信终端和无线移动通信网络,获取定位通信终端的网络身份ID,建立被监管对象与语音通信服务子系统之间的人机交互语音对话过程;在对话过程中,被监管对象根据播放的随机语音提示或要求输入其应答语音,定位通信终端采集和传送所述应答语音,语音通信服务子系统接收所述应答语音,并把接收的应答语音分别交给声纹认证服务子系统和语音内容识别服务子系统;声纹认证服务子系统对所述应答语音开展声纹识别,验证被监管对象的生物身份,把声纹认证结果交给信息存储服务子系统,若身份被拒绝则可能启动报警;语音内容识别服务子系统对所述应答语音开展语音识别或鉴别,鉴定应答语音的内容是否切合匹配系统播放的随机提示或要求,从而判断应答语音是来自真人现场说话还是录音回放产生的声音,并把应答语音的内容鉴定结果交给信息存储服务子系统,若存在录音回放欺诈则可能启动报警;综合所述网络身份ID、声纹认证结果和语音内容鉴定结果,可以判断被监管对象是否现场持有其指定使用的定位通信终端;将最后的语音监控结果交给语音通信服务子系统,在线语音播报给被监管对象,结束人机对话过程。\n[0071] 在所述人机交互语音对话过程中,人工预先录制的语音文件被用来组合系统的语音提示/要求以及语音监控结果的语音播报;在实际应用中,如果系统需要更加灵活的动态语音播报,还可以通过集成另外的文字语音合成服务来动态产生这些语音。\n[0072] 定位通信终端的网络身份ID的获取方式分为两种情况:\n[0073] (1)在被监管对象主动发起语音呼叫的情况下,语音通信服务子系统能自动探测识别所述定位通信终端的网络身份ID,信息存储服务子系统可以根据网络身份ID查询与其绑定的用户标识,而所述的用户标识具体地代表了所述被监管对象;\n[0074] (2)在语音通信服务子系统主动发起语音呼叫的情况下,先选择具体的某个被监管对象作为对话目标,让信息存储服务子系统根据该被监管对象的用户标识查询与其绑定的定位通信终端的网络身份ID,语音通信服务子系统根据所述网络身份ID外呼具有该网络身份ID的定位通信终端。\n[0075] 现有的基于定位技术的电子监控系统普遍存在一个“只认物、不认人”的致命缺陷,解决这一难题的重要方法是采用生物识别技术进行身份认证,而语音生物特征(声纹)识别是唯一可用于非接触式、通过电话网络远程安全控制的生物识别技术方法。\n[0076] 语音生物特征识别,又称说话人识别,俗称声纹识别,是根据说话人的发音生理和行为特征,自动识别说话人身份的一种生物识别方法。\n[0077] 声纹识别所提供的安全性可与其他生物识别技术(如:指纹、掌形和虹膜)相媲美,而且语音采集装置造价低廉,只需电话/手机或电脑麦克风即可,无需特殊的设备;它与说话语言无关,与方言腔调无关,不涉及隐私问题,适应人群范围很广;声音信号便于远程传输和获取,在基于电信和网络的身份识别应用中,声纹识别更为擅长,得天独厚。\n[0078] 在图2中,给出了利用声纹识别开展身份认证的工作过程:\n[0079] 声纹认证服务子系统105包括声纹特征提取单元1051、声纹模型构建单元1052、声纹模式匹配单元1053、以及声纹模型库1054。\n[0080] 声纹特征提取单元1051用于根据用户所说的语音,去除无效的语音片段(例如:\n静音和噪音等),开展语音数字信号处理,从该处理结果中提取可以表征该用户发音器官参数或发音方式及特点等的一组特征矢量,称为声纹特征,供后续的建模或比对时使用。\n[0081] 声纹特征提取单元1051是声纹模型构建单元1052和声纹模式匹配单元1053公用的模块。\n[0082] 声纹模型构建单元1052用于根据声纹特征提取单元1051从用户声纹建模用的语音中提取出来的声纹特征序列,为之构建特定的声纹模型。\n[0083] 为了充分表征该用户发音中的个性信息,该建模方法可以基于一种分类器或者混合使用多种分类器,常用的分类器可以包括神经网络(ANN)、支持向量机(SVM)、概率统计(HMM/GMM-UBM)、矢量量化(VQ)、动态时间规整(DTW)等。\n[0084] 声纹模式匹配单元1053用于利用从用户的验证语音中提取出来的声纹特征序列,与其所申明身份对应的已建立的声纹模型进行比对,得到相似度分数,再根据预设的判别阈值,确认是接受还是拒绝该用户,从而完成基于声纹识别技术的身份验证过程。\n[0085] 在上述声纹认证过程中,为了防止录音回放欺诈,还可以对全部或者部分验证语音开展语音内容识别,鉴定用户的应答语音的内容是否切合系统的随机提示或要求,从而验证是否真人在场说话判断;为了适应语音信道变化和人体声音老化等因素,可以利用验证语音对声纹模型进行更新与调整。\n[0086] 在图3中,给出了本发明监控方法的工作流程方框图,其基本监控思路如下:\n[0087] 在S10,部署电子监控系统,设置应用服务器和与之相连的监管操作终端,形成Browser/Server或Client/Server的网络服务架构;\n[0088] 在S20,执行被监管对象注册步骤,包括:采集被监管对象的个人信息和用于声纹注册的语音样本、注册被监管对象的个人信息和用户标识、根据其注册语音样本构建其声纹模型、指定其个人专用的定位通信终端、绑定其用户标识与其定位通信终端的网络身份ID、设置其监管方案和报警方案等;\n[0089] 在S30,按照被监管对象的监管和报警方案,针对其指定使用的定位通信终端,反复自动地执行定位监控步骤(参见图4),保存定位监控结果;\n[0090] 在S40,按照被监管对象的监管和报警方案,针对被监管对象,反复自动地执行基于声纹识别和/或语音内容识别的语音监控步骤(参见图5),保存语音监控结果;\n[0091] 此处的定位监控步骤和语音监控步骤,按照被监管对象的监管和/或报警方案的不同,可以分别独立地和/或并行地被执行。\n[0092] 在S50,周期性和/或临时执行交叉统计分析工作,即交叉对比分析在同一统计时间段内发生的语音监控和定位监控的结果,根据所述被监管对象是否现场持有其指定使用的定位通信终端以及该定位通信终端的移动轨迹,推断出所述被监管对象的人体活动轨迹,最终给出一个反映了所述被监管对象的人体活动轨迹和实际违规状况的完整报告。\n[0093] 在上述定位监控和语音监控步骤的执行过程中,被监管对象违规报警的发送步骤与对被监管对象的监控结果的存储步骤之间的先后执行次序无关。\n[0094] 在S60,监管工作人员不定期地要求调阅关于被监管对象活动的统计分析报告,评估其业绩表现,据此还可能适当地调整其监管方案,另外还可结合地理信息服务子系统提供的电子地图,观察被监管对象的活动轨迹和状态。\n[0095] 在图4中,给出了在S30中执行的定位监控的工作流程方框图,其基本步骤包括:\n[0096] 在S30l,根据采取的定位技术,定位通信终端和/或无线移动通信网络服务参与获取和传输所述定位通信终端的定位信息和网络身份ID;\n[0097] 在S302,应用服务器接收定位信息和网络身份ID,从所述定位信息中分析得出定位通信终端的地理位置;\n[0098] 在S303,查询所述网络身份ID所绑定的用户标识以及所述用户标识所代表的被监管对象的活动区域限制;\n[0099] 在S304,通过比较所述地理位置和所述活动区域限制决定所述定位通信终端的违规越界状态,将所述用户标识与本次定位监控的结果对应关联地存储,其中所述定位监控的结果包括网络身份ID、地理位置、定位时间、违规越界状态等;\n[0100] 在S305,执行条件判断,根据所述定位通信终端的违规越界状态采取不同的处理行动:如果没有发生违规越界,那么直接结束本次定位监控过程;否则,依照报警方案,按指定的方式向指定的对象发送报警通知,然后结束本次定位监控过程。\n[0101] 在图5中,给出了在S40中执行的语音监控的工作流程方框图,其基本步骤包括:\n[0102] 在S401,借助定位通信终端,在被监管对象与应用服务器之间,建立人机交互语音对话过程,从中获取所述定位通信终端的网络身份ID;依照监管方案,所述人机对话过程要么由被监管对象主动呼叫应用服务器来启动,要么由被监管对象被动接听来自应用服务器的语音呼叫来启动。\n[0103] 在实际应用中,通过系统随机对外呼叫被监管对象的人机对话启动方式更为有效,可以很好地杜绝被监管对象“人机分离”的现象。\n[0104] S402是一个条件决策步骤,但它只是在人机对话过程由被监管对象主动呼叫应用服务器而启动的情况下适用,在被监管对象被动接听语音呼叫的情况下,可以直接忽略这个步骤;在S402,查询是否存在一个被监管对象的用户标识与所述定位通信终端的网络身份ID对应绑定,如果不存在这样的用户标识,中断人机对话过程,并提前结束本次语音监控过程;否则,继续执行下一个步骤。\n[0105] 在S403,应用服务器通过定位通信终端播放系统随机的语音提示/要求,持有该定位通信终端的被监管对象按照系统的语音提示/要求输入对应的应答语音,应用服务器录取所述被监管对象输入的应答语音;为了录取更多的语音和更有效地鉴别录音回放的欺诈,S403所描述的提示-应答-录音步骤可以被连续多次地执行;在采集足够的应答语音后,分别通过S404和S405对所录取的应答语音开展声纹识别和语音内容识别。\n[0106] 在S404,对所录取的应答语音开展声纹识别,验证所述网络身份ID所绑定的被监管对象的生物身份;若其身份认证被否认则依照报警方案可能启动报警。\n[0107] 在S405,对所录取的应答语音开展语音内容识别,通过判断应答语音的内容是否切合匹配系统播放的随机语音提示/要求来鉴定该应答语音是由录音回放还是真人现场说话产生;若存在录音回放欺诈则依照报警方案可能启动报警。\n[0108] 在S406,通过综合S404和S405分别产生的识别结果,决定违规状态:被监管对象是否现场持有其指定使用的定位通信终端;将本次语音监控的结果与所述被监管对象的用户标识对应关联地存储,其中所述语音监控的结果包括:网络身份ID、声纹识别结果和/或应答内容鉴定结果、违规状态、监控发生时间等。\n[0109] 在S407,向所述被监管对象在线语音播报声纹认证的结果,中断人机交互语音对话过程,结束本次语音监控步骤。\n[0110] 在上述技术方案中,基于卫星定位和/或移动网络基站的无线定位技术本身,已经是非常成熟的现有技术;声纹识别/声纹认证技术的本身,也应视为现有技术;已经有多篇关于声纹认证或声纹识别的专利文献被公开,诸如CN 200610148399.3“具有特征筛选和阈值自适应的说话人身份确认系统”、CN 200710041252.9“基于声纹认证的网络支付方法和系统”、CN 200410086190.X“声纹认证系统和声纹认证程序”等,其均可作为有助于理解本申请技术方案的背景资料,故此,关于声纹识别/声纹认证和无线定位技术的工作方法、具体线路结构或原理,在此不再叙述。\n[0111] 在上述技术方案或说明书附图中所设涉及的各个模块、单元或系统,均采用本领域的通用技术术语和描述方法,本领域的技术人员,在充分领会和掌握了本发明解决问题的方法、思路及系统构成拓扑结构后,完全可以不经过创造性的劳动,实现与之相同或相似的技术效果,达到相同的实施目标,故在此不再叙述。\n[0112] 现有的无线/电子定位技术存在“只认物,不认人”的缺陷,而声纹识别作为一种非接触式的、可以远程安全操控的生物识别技术,正好具有“只认人,不认物”的优点,本发明的技术方案将这两种技术方法交叉融合起来,真正意义上达到对被监管对象人体的远程定位跟踪。\n[0113] 由于本发明的技术方案充分/有机地融合了声纹识别技术和定位跟踪技术,不仅可以通过定位通信终端装置物来间接地跟踪被监管对象,而且通过声纹认证开展语音监控的方式,可以有效地防止被监管对象采取“人机分离”的方式逃脱电子监控,克服了现有的基于定位技术的电子监控系统普遍存在的“只认物、不认人”的缺陷。\n[0114] 本发明可广泛用于非接触式电子监控和身份识别领域。
法律信息
- 2016-11-30
未缴年费专利权终止
IPC(主分类): G10L 17/00
专利号: ZL 200910196988.2
申请日: 2009.10.10
授权公告日: 2012.07.04
- 2012-07-04
- 2010-04-28
实质审查的生效
IPC(主分类): G10L 17/00
专利申请号: 200910196988.2
申请日: 2009.10.10
- 2010-03-17
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2006-07-26
|
2006-01-26
| | |
2
| |
2006-07-26
|
2006-02-23
| | |
3
| |
2007-07-18
|
2006-12-30
| | |
4
| |
2003-10-08
|
2002-11-15
| | |
5
| |
2006-02-08
|
2005-08-04
| | |
6
| |
2009-07-15
|
2008-01-08
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |