著录项信息
专利名称 | 基于多生物特征识别的智能门禁系统 |
申请号 | CN201010581472.2 | 申请日期 | 2010-12-09 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2011-04-27 | 公开/公告号 | CN102034288A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G07C9/00 | IPC分类号 | G;0;7;C;9;/;0;0;;;G;0;6;K;9;/;0;0查看分类表>
|
申请人 | 江南大学 | 申请人地址 | 江苏省无锡市滨湖区绣溪路58号-20-403
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 江苏华御信息技术有限公司 | 当前权利人 | 江苏华御信息技术有限公司 |
发明人 | 周治平;李雨凇 |
代理机构 | 无锡市大为专利商标事务所 | 代理人 | 曹祖良 |
摘要
本发明涉及一种基于多生物特征识别的智能门禁系统,其包括声音采集设备及图像采集设备;门禁控制器分别接收声音信号及图像采集设备采集的人脸图像信号;门禁控制器的输出端分别与数据处理器及电控门锁相连;门禁控制器将接收的声音信号及人脸图像信号传输到数据处理器内;所述数据处理器分别对接收的声音信号及人脸图像信号进行特征提取,对采集的声音信号与人脸图像信号进行识别,并将特征提取后相应信号进行归一化与分类融合处理;数据处理器将分类融合处理后相应的信号与预设的样本库相比较;当分类融合处理后得到的信号与样本库内相应信号匹配时,门禁控制器打开电控门锁。本发明提高了识别的可靠性,准确率高,识别方便,安全可靠。
1.一种基于多生物特征识别的智能门禁系统,包括声音采集设备及图像采集设备,其特征是:所述声音采集设备及图像采集设备均与门禁控制器的输入的相连,所述门禁控制器分别接收声音采集设备采集的声音信号及图像采集设备采集的人脸图像信号;门禁控制器的输出端分别与数据处理器及电控门锁相连;门禁控制器将接收的声音信号及人脸图像信号传输到数据处理器内;所述数据处理器分别对接收的声音信号及人脸图像信号进行特征提取,对采集的声音信号与人脸图像信号进行识别,并将特征提取后相应信号进行归一化与分类融合处理;数据处理器将分类融合处理后相应的信号与预设的样本库相比较;当分类融合处理后得到的信号与样本库内相应信号匹配时,门禁控制器打开电控门锁;
所述数据处理器包括DSP;
所述数据处理器利用主成分分析法与线性判别分析法对人脸图像信号进行特征提取及人脸识别;
所述数据处理器利用梅尔倒谱系数与混合高斯模型方法对声音信号进行特征提取及人脸识别;
所述数据处理器利用z-score函数对识别后的声音信号与人脸图像信号进行归一化;
所述数据处理器利用支持向量机对归一化后的声音信号与人脸图像信号进行分类融合处理;
所述门禁控制器的输出端还与声光报警器相连;当分类融合处理后得到的信号与数据处理器内样本库不匹配时,门禁控制器通过声光报警器输出声光报警信号。
基于多生物特征识别的智能门禁系统\n技术领域\n[0001] 本发明涉及一种门禁系统,尤其是一种基于多生物特征识别的智能门禁系统,属于门禁系统的技术领域。\n背景技术\n[0002] 目前,传统的门禁系统的身份鉴别手段包括口令、密码、证件等等。由于与被鉴别人的可分离性,易造成伪造、盗用、破译等现象。而人体的生物属性是人的本体独有的,而且人的某些生物属性如指纹、虹膜、声音等是唯一的,将其应用在门禁系统可以杜绝伪造、盗用等现象的产生。生物特征识别技术主要分为两大类:一类是生理特征识别,分别是利用指纹,掌型,虹膜,视网膜及人脸等特征进行识别;另一类是行为特征识别,包括签名和语音识别。采用单一模态的生物特征认证技术容易受到噪声的干扰和使用环境的限制,并且容易伪造仿冒,很难保证门禁系统识别的准确性。\n发明内容\n[0003] 本发明的目的是克服现有技术中存在的不足,提供一种基于多生物特征识别的智能门禁系统,其提高了识别的可靠性,准确率高,识别方便,安全可靠。\n[0004] 按照本发明提供的技术方案,所述基于多生物特征识别的智能门禁系统,包括声音采集设备及图像采集设备;所述声音采集设备及图像采集设备均与门禁控制器的输入相连,所述门禁控制器分别接收声音采集设备采集的声音信号及图像采集设备采集的人脸图像信号;门禁控制器的输出端分别与数据处理器及电控门锁相连;门禁控制器将接收的声音信号及人脸图像信号传输到数据处理器内;所述数据处理器分别对接收的声音信号及人脸图像信号进行特征提取,对采集的声音信号与人脸图像信号进行识别,并将特征提取后相应信号进行归一化与分类融合处理;数据处理器将分类融合处理后相应的信号与预设的样本库相比较;当分类融合处理后得到的信号与样本库内相应信号匹配时,门禁控制器打开电控门锁。\n[0005] 所述数据处理器包括DSP。所述数据处理器利用主成分分析法与线性判别分析法对人脸图像信号进行特征提取及人脸识别。\n[0006] 所述数据处理器利用梅尔倒谱系数与混合高斯模型方法对声音信号进行特征提取及人脸识别。所述数据处理器利用z-score函数对识别后的声音信号与人脸图像信号进行归一化。\n[0007] 所述数据处理器利用支持向量机对归一化后的声音信号与人脸图像信号进行分类融合处理。所述门禁控制器的输出端还与声光报警器相连;当分类融合处理后得到的信号与数据处理器内样本库不匹配时,门禁控制器通过声光报警器输出声光报警信号。\n[0008] 本发明的优点:门禁控制器同时接收声音采集设备与图像采集设备的声音信号、人脸图像信号;数据处理器对声音信号利用梅尔倒谱系数和混合高斯模型方法进行特征提取和声音识别,数据处理器对人脸图像信号利用主成分分析法和线性判别分析法进行特征提取和声音设备,数据处理器对提取和识别后的声音信号及人脸图像信号进行Z-score归一化和支持向量机分类融合,降低了识别的等错率,提高了门禁系统的安全可靠性,安全可靠。\n附图说明\n[0009] 图1为本发明的结构框图。\n[0010] 图2为本发明的工作流程图。\n具体实施方式\n[0011] 下面结合具体附图和实施例对本发明作进一步说明。\n[0012] 如图1所示:本发明包括图像采集设备、声音采集设备,电控门锁、门禁控制器、数据处理器及声光报警器。\n[0013] 多生物特征融合是指利用生物特征不同的特性,进行某种层面的融合,其目的是克服或者规避单一特征的局限性;本发明通过对人脸图像和声音信号多位门禁的两个生物特征。通过把不同生物特征信息结合在一起进行融合认证降低了不利因素的影响,为解决单一模态的生物特征识别的不足带来了有效的解决方案。人脸图像和声音信息具有相对的唯一性和稳定性,并且采集方便,具有非接触性和非侵犯性。适合于门禁系统作为鉴别特征来使用。\n[0014] 如图1所示:所述图像采集设备与声音采集设备的输出端与门禁控制器的输入端相连,所述图像彩采集设备采用摄像头,作为特征采集工具,采集来访者的人脸图像;声音采集设备采用麦克风,作为特征采集工具,采集来访者的声音信号。门禁控制器的输出端与数据处理器相连,所述数据处理器包括DSP(数字信号处理器),所述数据处理器能够进行人脸识别和声音识别,所述数据处理器内预先存储有相关的人脸信息和声音信息。门禁控制器接收图像采集设备采集的人脸图像信号及声音采集设备采集的声音信号,并将上述信号传输到数据处理器内。所述数据处理器对接收的声音信号利用梅尔谱倒频系数(MFCC)及混合高斯模型(GMM)进行特征提取和声音识别;数据处理器对接收的人脸图像信号利用主成分分析法(PCA)及线性判别分析法(LDA)进行特征提取和人脸识别。为了降低分类比较的等错率,数据处理器通过Z-score函数对对识别后的声音信号和人脸图像信号进行归一化处理,消除利用不同生物特征识别的结果差异,减小由于类别不同而引起的误差;数据处理器在进行归一化处理后,再利用支持向量机(SVM)方法对上述归一化结果进行分类,达到决策层融合处理。数据处理器将上述融合处理后的声音信号及人脸图像信号和数据处理器内预存的样本库间进行比较,当采集的声音信号及人脸图像信号与样本库内相应的信号相匹配时,数据处理器向门禁控制器发出开门指令,门禁控制器打开电控门锁;当采集的声音信号和人脸图像信号与样本库不匹配时,门禁控制器通过声光报警器发出声光报警信号,确保门禁系统的安全。\n[0015] 数据处理器对人脸图像信号利用主成分分析法(PCA)及线性判别分析法(LDA)进行特征提取和人脸识别,其中,主成分分析(PCA)是一种统计方法,它借助于一个正交变换,将分量相关的原随机向量转化成分量不相关的新随机向量,在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,样本点散布最开。线性判别分析(LDA)在模式识别领域有着重大的影响,线性判别分析方法可应用于图像降维,它是一种基于样本的类别进行降维的方法。它的投影矩阵通过最大化类间分布,同时最小化类内散布获得。\n[0016] 线性判别分析人脸识别方法描述如下:\n[0017] 假设原始图像库中共有N个图像,假设每个图像共有d个像素点,则原始人脸图像向量可以表示为X1,X2,Λ XN(向量维数设为d),其中N1个人脸图像属于1类,N2个人脸图像属于2类,NC个人脸图像属于C类(其中N1+N2+…+NC=N)。则各类人脸图像的均值为:\n[0018] \n[0019] 总的人脸图像的均值为:\n[0020] \n[0021] 样本类间离散度矩阵SB和类内离散度矩阵Sw定义为:\n[0022] \n[0023] \n[0024] 如果Sw(类内离散度矩阵)是非奇异的,则要获得类间离散度与类内离散度的比值最大的投影方向的Wopt满足下式:\n[0025] \n[0026] 其中{wi|i=1,2,L,m}是满足下式的SB和Sw对应的m个最大特征值{λi|i=\n1,2,L,m}所对应的特征向量:SBWi=λiSWWi(i=1,2,L,m)。注意到该矩阵最多只有C-1个非零特征值,C是类别数目。\n[0027] 利用线性投影算子,每一幅人脸图像可以映射得到一个低维的特征向量。该向量的元素通过图像向量与投影算子的每一个列向量分别做内积运算得到。\n[0028] 无论PCA方法还是LDA方法都需要大量的实验样本,而实际生活中并不可能完全满足样本数量的要求,为了解决小样本可能存在的问题,数据处理器采用PCA+LDA的方法来进行人脸识别。\n[0029] 设对pij(j=1,2,...,S;i=1,2,...,K)为PCA得到的第i类人脸第j个人脸向量的特征投影,S是每类的样本数,K是训练样本总数。\n[0030] 首先计算各类样本的均值μi和总样本均值μ,从各样本的图像减去对应的类均值,即各类训练样本中心化,然后,从各类均值中减去总样本均值得到μi,把所有中心化的训练样本图像组成数据矩阵,并通过PCA方法为这个数据矩阵寻找正交基。设求出的正交基为U,将所有中心化的图像投影到正交基上。\n[0031] \n[0032] 其中,标识样本特征值,把所有的中心化的均值投影到正交基上,完成了PCA的过程:\n[0033] \n[0034] 最后将求得的参数代入LDA的以下公式中:\n[0035] 求解类间集散度矩阵SB和类内离散度矩阵SW。其中:\n[0036] \n[0037] \n[0038] \n[0039] 计算广义特征值Λ和对应的特征向量V:\n[0040] SBV=λSWV (11)\n[0041] 根据对应特征值由大到小的顺序排列特征向量,仅保留前K-1个特征向量,这就是Fisher基向量。把旋转过的原始图像投影到Fisher基向量上,就是说先把原始图像投影到正交基U上,再把得到的投影图像继续投影到Fisher基向量W上。然后进行分类识别工作,计算出人脸识别的识别率。\n[0042] 梅尔倒谱系数(Mel-Frequency Cepstrum Coefficient,MFCC)是对人耳滤波功能的一个模拟,在低频部分呈线性的增长,在高频部分呈指数性的增长,是最有效的一种说话人识别的特征。目前,对于文本无关的声纹识别主要采用MFCC特征。梅尔倒谱系数特征参数提取过程为预处理分帧、FFT(快速傅里叶变换)、梅尔滤波器、取对数及DCT(离散余弦变换)变换过程。\n[0043] 统计模型中的概率密度函数是对说话人特征在特征空间这种分布的完整描述,一个说话人的特征分布概率密度函数就可以成为这一说话人的模板。\n[0044] GMM(混合高斯模型)是概率统计模型,通过对目标说话人特征分布的统计描述来区分说话人,其统计参数能有效地表示话者的特征信息,因此可以利用GMM来做特征空间的映射。它具有与文本无关、处理速度快、识别效果好等优点,已成功地运用于与文本无关的说话人识别和确认中。\n[0045] GMM是M个成员高斯概率密度的加权和,表示为:\n[0046] \n[0047] 其中,x是D维随机向量;bi(x)(i=1,2,...,M)是每个成员的高斯概率密度函数;ai(i=1,2,...,M)是混合权值。\n[0048] 完整的GMM可表示为:\n[0049] λi={ai,μi,∑i},(i=1,2,L,M) (13)[0050] 每个成员密度函数是一个D维变量的高斯分布函数,表示为:\n[0051] \n[0052] 对于一个长度为T的测试语音时间序列X=(x1,x2,...,xT),它的GMM似然概率可表示为:\n[0053] \n[0054] (16)\n[0055] \n[0056] 识别时运用贝叶斯定理,在N个未知话者的模型中,得到似然概率最大的模型对应的话者即为识别结果:\n[0057] \n[0058] 在实际应用中,每个GMM模型的规模通常取为30-50个高斯分布。\n[0059] 在人脸识别和声纹识别过程中,每个子识别系统会给出一个匹配结果s(score)来表征测试样本与匹配模板的相似度。由于处理的样本数据有差异,人脸识别系统与声纹识别系统的决策形式上会存在差异。为了消除数值形式差异对最后分类结果的影响,首先利用归一化函数把来自不同分类器的不同值域区间与度量方法的s转化为同一值域区间可以互相比较的s′,然后利用分类能力较强的SVM分类器对归一化的s′进行分类。在本文中,采用归一化函数采用Z-score函数。\n[0060] 具体应用于实验的Z-score函数的形式:\n[0061] \n[0062] 在这里s′是归一化后的匹配结果,mean( )和std( )分别代表求均值与求均方差运算,{s}是一个分类器对所有测试样本的匹配打分集合。这种归一化方法比较简单,只需要估计均值和方差就可以对s进行归一化。\n[0063] 对归一化后的结果采用了SVM进行分类,充分利用了归一化后s′的信息;与直接采用SVM分类器相比,进行归一化可以将结果调整到可以比较的同一数值区间,使分类结果更加准确。采用归一化SVM融合方式的系统性能会比直接相加方式有较大提高,而且当分类数越多提高越明显。这是由于当分类数越大时,每个子系统的性能会变差,各子系统之间的关系也变复杂。如果只对各子系统的决策分数直接相加的时候,系统性能会随着分类数的增多而越来越差。反而SVM融合模型可以较为充分地描述各子系统之间的非线性关系,所以性能会有所改进。因而,当分类数越大时,SVM融合的优势就越明显。\n[0064] 如图2所示:工作时,输入声像检测设备持续检测声音信号或图像信号;当有来访者时,声音采集设备与图像采集设备启动,分别采集来访者的声音信号和人脸图像信号。\n门禁控制器将声音信号和人脸图像信号输出到数据处理器内,数据处理器对声音信号利用梅尔倒谱系数和混合高斯模型进行特征提取和声音识别;同时利用PCA和LDA对人脸图像信号进行特征提取和人脸识别。数据处理器对识别后的声音信号和人脸图像识别后,通过Z-score函数进行归一化处理,并通过SVM对归一化的数据进行融合处理,从而形成决策层融合。当决策层融合后的数据与数据处理器内的样本库进行比较,当融合数据与样本库的数据相匹配时,数据处理器向门禁控制器发出匹配信号,门禁控制器打开电控门锁,完成开门动作;当融合数据与样本库内的数据不匹配时,数据处理器启动计数器,对比较次数进行比较;当比较达到设定次数时,门禁控制器通过声光报警器输出声光报警信号;当比较次数小于设定次数时,门禁控制器重新接收声音采集设备和图像采集设备的采集信号。\n[0065] 本发明通过对人脸图像信号和声音信号进行采集,并采用现有的处理方法对人脸图像和声音信号进行特征提取和识别,可以应用于机场、银行、公安机关、考勤系统或其他方面。\n[0066] 本发明门禁控制器同时接收声音采集设备与图像采集设备的声音信号、人脸图像信号;数据处理器对声音信号利用梅尔倒谱系数和混合高斯模型方法进行特征提取和声音识别,数据处理器对人脸图像信号利用主成分分析法和线性判别分析法进行特征提取和声音设备,数据处理器对提取和识别后的声音信号及人脸图像信号进行Z-score归一化和支持向量机分类融合,降低了识别的等错率,提高了门禁系统的安全可靠性,安全可靠。
法律信息
- 2018-11-23
未缴年费专利权终止
IPC(主分类): G07C 9/00
专利号: ZL 201010581472.2
申请日: 2010.12.09
授权公告日: 2012.06.20
- 2013-12-11
专利权人的姓名或者名称、地址的变更
专利权人由无锡华御信息技术有限公司变更为江苏华御信息技术有限公司
地址由214081 江苏省无锡市滨湖区锦溪路100号恒华科技园20号楼403室变更为214081 江苏省无锡市滨湖区绣溪路58号-20-403
- 2013-05-08
专利权的转移
登记生效日: 2013.04.19
专利权人由江南大学变更为无锡华御信息技术有限公司
地址由214122 江苏省无锡市蠡湖大道1800号变更为214081 江苏省无锡市滨湖区锦溪路100号恒华科技园20号楼403室
- 2012-06-20
- 2011-06-15
实质审查的生效
IPC(主分类): G07C 9/00
专利申请号: 201010581472.2
申请日: 2010.12.09
- 2011-04-27
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| | 暂无 |
2006-09-12
| | |
2
| |
2003-11-19
|
2003-03-07
| | |
3
| |
2001-07-18
|
1999-12-13
| | |
4
| |
2009-07-15
|
2009-01-10
| | |
5
| |
2006-06-28
|
2005-12-31
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2016-08-26 | 2016-08-26 | | |