著录项信息
专利名称 | 基于局部特征分析的计算机笔迹鉴别方法 |
申请号 | CN200310104462.X | 申请日期 | 2003-10-29 |
法律状态 | 暂无 | 申报国家 | 暂无 |
公开/公告日 | 2004-10-27 | 公开/公告号 | CN1540571 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/00 | IPC分类号 | G;0;6;K;9;/;0;0查看分类表>
|
申请人 | 中国科学院计算技术研究所 | 申请人地址 | 广东省东莞市松山湖高新技术产业开发区科汇路1号中科院云计算中心19楼
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 国云科技股份有限公司 | 当前权利人 | 国云科技股份有限公司 |
发明人 | 刘宏;李锦涛;崔国勤 |
代理机构 | 中科专利商标代理有限责任公司 | 代理人 | 周国城 |
摘要
一种基于局部特征分析的计算机笔迹鉴别方法,主要解决了特征字的局部书写特征的提取和描述问题。首先用线性归一化方法将特征字图像归一化到64×64大小;然后根据笔划方向、位置和粗细等特性,设计了一组优化的2维Gabor滤波器,采用8个方向和一个频率,共8个Gabor小波;接着,为了得到特征字的局部书写特征,对特征字进行8像素间隔的空间采样,并提取64个采样点上的Gabor小波系数,这样得到512维特征向量;最后利用基于以均值作为类代表点的最近邻分类器进行比较和判别。该发明具有识别率高、计算复杂度低、物理意义明确等特点。
基于局部特征分析的计算机笔迹鉴别方法\n技术领域\n:本发明涉及计算机自动生物鉴别技术领域,特别是一种与书写内容相关的基于局部特征分析的计算机笔迹鉴别方法,目的是为了实现计算机自动笔迹鉴别,在笔迹图像的归一化方面、笔迹特征提取和描述方面做了有意义的探索,以推动笔迹鉴别技术的发展。笔迹鉴别通过书写风格进行身份鉴别,有广泛的应用前景,例如在法庭上根据遗嘱鉴别撰写人、在金融领域一些重要单据的签名验证、计算机终端登陆人的认定、或者鉴别一份手稿谁进行了修改等。\n背景技术\n:尽管人工笔迹鉴别达到了比较准确的地步,但计算机自动笔迹鉴别却是个难题。笔迹鉴别利用笔迹的不同书写风格进行身份鉴别,其关键在于笔迹特征的提取和比较。然而书写风格很难从少量的字符归纳,所以要么采用文本独立方法,与书写内容无关,从大量字符中提取反映书写风格的整体特征,要么采用文本依存方法,与书写内容相关,从检验笔迹和参考笔迹中选择相同或部分相同的字符即特征字进行比较。文本独立方法人工干预少,但需要大量的字符,可靠性受到限制。而汉字的特点是结构复杂,笔迹特征对字符类别敏感,文本依存方法可以提取更多的特征,只用少数字符即可实现可靠的鉴别。本发明就涉及一种与书写内容相关的即文本依存的笔迹鉴别方法。\n从19世纪60年代开始,很多学者投入到这一研究领域,提出了一些方法。总的来说,笔迹鉴别提取的特征主要有两类,一是结构特征,例如字的平均字高、字宽、倾斜度以及字符的可懂度等。这种方法得到特征字的外形特征,如果书写方式变化较大,则特征提取不准确;二是纹理特征;另外,还有将整篇、段、字符相结合的多级特征提取方法。但总体而言,以上方法大多提取文本块或特征字的全局特征,计算复杂度高,一些方法不适于汉字,笔迹鉴别的总体水平还不高。目前笔迹鉴别存在的主要问题是笔迹特征分析和比较技术没有有效的解决。本发明主要提出了一种新的有效的与书写内容相关的基于局部特征分析的笔迹特征提取方法。\n发明内容\n:本发明的目的在于提供一种与书写内容相关的基于局部特征分析的计算机笔迹鉴别方法,主要解决了特征字的局部书写特征的提取和描述问题。\n针对文本依存的笔迹鉴别,本发明采用优化的Gabor多通道滤波器和有效的特征字空间采样间隔提取特征字的局部纹理特征,并利用基于以均值作为类代表点的最近邻分类器进行比较和判别方法。\n为实现上述目的,本发明主要有以下步骤:特征字的获取采用人机交互方式;特征字图像的归一化采用字符的线性归一化方法一点阵撑满法,将特征字图像归一化到64×64大小;然后根据笔划方向、位置和粗细等特性,设计了一组优化的2维Gabor滤波器,该滤波器含有8个Gabor小波,分别采用8个方向和一个频率。接着,用优化的Gabor滤波器提取特征字的局部纹理特征。具体方法是对归一化后的64×64大小的样本图像进行空间采样,采用8个像素的采样间隔,这样每个特征字有64个采样点,以每个采样点为中心,分别和8个Gabor小波进行卷积,得到采样点周围的笔划方向和笔划粗细信息作为特征字的局部特征,并取Gabor响应的振幅做为笔迹特征,这样得到512维特征向量。最后利用基于以均值作为类的代表点的最近邻分类器进行笔迹特征的比较和识别。\n2维Gabor滤波能表示图像的局部频谱信息,具有方向选择性。本发明具有识别率高、计算复杂度低、物理意义明确等特点,对于减轻文检人员的压力,进行计算机笔迹鉴别有较高的实用价值。\n发明的技术方案一种与书写内容相关的基于局部特征分析的计算机笔迹鉴别方法,其特征在于:\n特征字的获取采用人机交互方式;特征字图像的归一化采用字符的线性归一化方法;利用优化的Gabor滤波和有效的空间采样间隔,提取特征字的局部纹理特征;利用基于以均值作为类代表点的最近邻分类器进行笔迹特征的比较和识别;附图说明:以下结合附图及实施方式对本发明作进一步的详细说明:图1为本发明的三个不同书写人的归一化笔迹图像示意图,为进行特征字归一化前后的图像对比。\n图2为本发明的采样点的选取和特征提取过程示意图,包括8个Gabor滤波器实部在空域中的图像表示、特征字空间采样间隔的选取以及特征提取过程。\n发明的具体实施方式\n:1.特征字预处理:在文本依存的笔迹鉴别中,计算机自动选字是个难题。以前主要采用专家参与挑选,手工分割特征字的方法。本发明对此进行了改进,采用人机交互方法。首先将书写笔迹文件按300DPI扫描成数字图像,进行二值化和行字分割,并去掉字符四周的空白,然后由人工挑选特征字,最后以单个特征字的形式存储。\n手写汉字即使出自同一个书写人,由于环境、心情、用笔和用纸的影响,其尺寸差别也较大,所以在特征提取之前需要对特征字进行归一化处理,这是实现两个字符最佳匹配的关键。在字符识别应用中,归一化主要包含尺度归一化、倾斜校正以及笔划厚度的归一化。但在笔迹鉴别中,字符的倾斜和笔划厚度体现了书写特征,需要保留,所以我们仅对尺寸进行归一化。\n目前有许多字符归一化方法,可分为线性归一化和非线性归一化。对于笔迹鉴别应用,字符的方位、笔划的位置和方向都是有用的特征,必须在归一化过程中予以保留。综合考虑后,我们采用线性归一化——点阵撑满方法,将原图像中的像素点线性映射到归一化图像中,变换后的图像中大部分像素点上的像素值采用线性映射方法得到,其余像素点上的像素值采用最近邻插值方法得到。该算法实现简单,而且保留了字符的书写特征。假设原始样本为W×H大小的图像,(x,y)表示原始图像上的像素点位置。归一化图像为N×N,映射公式如下:x′=sxxy′=syy,]]>其中尺度因子:sx=NWsy=NH]]>变换后的图像中大部分像素点上的像素值采用以上映射方法得到,其余像素点上的像素值采用最近邻插值方法得到。如图1是三个不同书写人写的“数”字。图1(a)是书写人1写的,左边是按300DPI扫描的原始特征字图像,右边是归一化后的64×64大小的图像,可见笔划的方向和分布在归一化后有了较好的保留。图1(b)和图1(c)是另外两个人书写的归一化后的“数”字,从图像纹理来看,不同书写人的特征字之间的类间差别大于同一书写人的特征字之间的类内差别,这正体现了笔迹鉴别的基础和依据。\n2.笔迹特征提取笔迹的特征主要由笔划的位置、方向、粗细、分布的密度等因素决定。\n其中所述的笔迹特征提取方法的新颖性在于,据归一化后的特征字,统计出笔划方向、位置和粗细等特性,由此设计了一组优化的2维Gabor滤波器,该滤波器含有8个Gabor小波,分别采用8个方向和一个频率信息,接着,用优化的Gabor滤波器提取特征字的局部纹理特征,具体方法是对归一化后的64×64大小的样本图像进行空间采样,采用8个像素的采样间隔,本发明还结合有效的特征字空间采样间隔,采用8个像素的间隔,这样每个特征字有64个采样点,以每个采样点为中心,分别和8个Gabor小波函数进行卷积,得到采样点周围的笔划方向和笔划粗细信息作为特征字的局部特征,并取Gabor响应的振幅做为笔迹特征,这样得到512维特征向量。该特征向量反映了特征字64个采样点周围的笔划方向和笔划粗细等局部纹理信息。\n2.1 GaborGabor函数早在1946年由D.Gabor提出,是小波基中的一种,属于一种窗口Fourier变换,其窗口是Gauss函数。Gabor函数克服了傅立叶变换只能反映信号整体特征的缺陷,能同时在时域和频域中较好地兼顾对信号分析的分辨率要求。2维Gabor小波能表示简单视觉细胞的感受野信息,80年代,J.G.Daugman将将2维Gabor小波表示用于计算机视觉领域,取得了较好的结果。到90年代中期,一些研究者将Gabor滤波用于字符识别的特征提取。但目前为止还没有人将其用于文本依存的笔迹鉴别中,本发明在这方面做了突破。\n2维Gabor函数(如公式1)是加窗的Fourier变换,其窗口是Guass函数,能得到图像的局部频域特性。Gabor函数是时间定位和频率调制得带通滤波器,通过调节合适的参数,可以构造具有不同形状、带宽、中心频率、方向的属性的Gabor滤波器组,变换的结果是对信号进行多通道分解。\nh(x,y)=k2σ2exp(-k2(x2+y2)2σ2)[exp(ik1x+ik2y)-exp(-σ22)]---(1)]]>其中: 上式可以看作由两部分组成:第一部分为以原点为中心,标准差为σg=σ/kv的圆对称的2维Gauss函数,σg的值决定了窗口函数的宽度,对应时域的信号分析尺度,尺度越大,分辨率越低(本发明取σ=2π]]>)。第二部分如果仅考虑exp(ik1x+ik2y)=cos(k1x+k2y)+isin(k1x+k2y),可以理解成2维的余弦、正弦波。其中,参数m为方向的个数,如当m=4时,4个方向角分别是:0,45,90,135。参数V,u决定了波长和旋转方向。例如虚部sin(k1x+k2y)是频率为kv,相位为0的2维正弦波,其周期为2π/kv。选取不同参数m,v,u的值,可以得到一组Gabor滤波器,在空间域体现为具有一定方向、频率和带宽的一组光栅,可以从一个足够小的区域得到类似边缘的特征。而方向和边缘特征在笔迹鉴别中非常重要。\n如果不考虑最后一项exp(-σ2/2),Gabor函数在频率中的表示如下:H(λ1,λ2)=k22πσ2exp[-σ22k2((λ1-k1)+(λ2-k2))]---(2)]]>\n函数H(λ1,λ2)为在频率域中,为以点(k1,k2)为中心,标准差为kv/σ=1/σg的2维Gauss函数,对应频域中的分辨率。可见Gabor函数在时域和频率的分辨率成反比,两者的联合分辨率有限,这就是视觉中得不确定性。\n2.2优化的Gabor滤波设计根据图2所示,2维Gabor函数在时间域中体现为不同大小、不同方向、不同宽度的光栅图像。可以根据归一化后特征字的笔划宽度、笔划方向等确定Gabor参数以及采样点的选择。根据我们采集到的笔迹样本,归一化后的64×64大小的图像中,笔划的方向大多分布在水平、垂直和带方向的线上。为了提取到更多的笔迹特征,本发明取Gabor核函数为8个方向,m为8,即v=0,...,7。另外,笔划的宽度大多在3到5个像素,对应Gabor光栅的宽度。反映在Gabor函数上,就是正弦波波长的一半。由上一部分的分析得知,半个波长为π/kv=2v+22,]]>当v=2时,半个波长为4个像素,符合归一化为64×64大小后笔划的平均宽度。这样本发明采用8个Gabor滤波器,即具有8个方向,单个频率(v=2)的一组优化的Gabor滤波器组。这组滤波通道,使得图像中的信息得以有效的保存。\n为了减少计算量,同时为了提取特征字相应空间位置上的Gabor特征,需要对归一化图像进行采样,选取一些采样点。为避免信息丢失,需要考虑有效的采样间隔。当v=2时,Gabor函数中2维高斯函数的标准差为σg=σ/kv=2v+32=8,]]>理论上Gauss核中心点周围的能量保留的最多,其能量主要集中在带宽为σg的部分,越往外能量越弱。所以本发明采用空间间隔为8个像素,间隔再大点,可能会有信息丢失。再小一点会增加特征向量的维数和计算复杂度。\n根据以上讨论,我们将64×64大小的特征字分成8×8个网格,取每个网格的中心点作为采样点,如图2得到64个采样点。采样间隔inter=8。在离散的空间卷积中,实部和虚部是分开计算的。\n以采样点(X,Y)为中心的Gabor特征如下:g(X,Y)=|Σx=-X64-X-1Σy=-Y64-Y-1I(X+x,Y+y)h(x,y)|]]>I(x,y)表示64×64的二值图像,h(x,y)表示Gabor滤波器,|a|表示a的模。Gabor特征可以看作在给定采样点处,Gabor滤波的响应。如图3所示,对于每个采样点,用8个Gabor滤波器进行卷积,得到8个Gabor特征。为了消除相位漂移,采样点上的特征值由振幅表示。所以,每幅图像可以得到512(64×8)个Gabor特征作为特征向量。\n其中利用基于以均值作为类代表点的最近邻分类器进行特征的比较和识别,将每类样本特征向量的均值做为该类的代表点,待判别的样本的特征向量和笔迹库里所有的类求欧氏距离,并将距离按从大到小的顺序排列,取排在前几位的笔迹对应的书写者作为候选人。\n最后,本发明采用欧氏距离函数:D(f,g)=1nΣi=1n(fi-gi)2,]]>采用最近邻分类器,对距离函数:L(f)=argmink{Dk(f,g)},]]>进行排序,取排在前几位对应书写者作为识别的候选者。\n3.实验结果为了验证本发明提出的方法,我们设计了含有26个字的一句话,请17个人书写,每人重复书写15到20遍。然后采用300DPI的分辨率扫描到计算机中,进行行字分割,并从中选取分割的比较好的5个字“数、据、科、学、院”做为实验样本用。笔迹库中有17个书写人,每人有5个特征字。每个特征字有多幅归一化后的样本,其中5幅样本用于训练,将训练样本特征向量的均值作为该类的代表存入模式库;将另外的每人3到8幅样本用于识别。我们分别对5个单特征字进行了测试,取平均识别率作为单个特征字的识别率。为了提高识别的准确率,还对多特征字融合的方法进行了实验。笔迹鉴别中有许多纹理提取方法,为了和本发明提出的方法进行比较。我们根据自动化所刘成林的博士论文实现了简化的Wigner方法。表1和表2分别给出了优化的Gabor滤波器和Wigner方法在用1到5个特征字进行笔迹识别的识别结果。针对每种特征字组合,给出排在前5位的候选者。其中,在单个特征字时,Gabor方法比Wigner方法排在第一位的识别率高出近16个百分点。而且,优化的Gabor方法仅用3个特征字,排在第二位的识别率就能达到100%,而Wigner方法需要4个特征字,排在第4位的识别率才能达到100%。当然这和建立的笔迹库有关,但实验结果说明本发明提出的算法比Wigner更有效。为了减少计算时间,本发明先将Gabor核函数计算出来,并存在内存中,以后只要读取相应数据,与特征字进行采样点上的卷积操作即可,可大大的节省时间,提高效率。在PC机主频P4 1.7G HZ,256兆内存,40G硬盘条件下,用Gabor方法特征提取时间为每个特征字平均用16毫秒,而Wigner是48毫秒。\n表1.优化的Gabor滤波方法的正确识别率(%)表2.Wigner方法的正确识别率(%)Gabor方法,512维m=8,v=2,inter=8\nWigner方法,256维
法律信息
- 2018-12-07
专利权人的姓名或者名称、地址的变更
专利权人由国云科技股份有限公司变更为国云科技股份有限公司
地址由523808 广东省东莞市松山湖科技产业园区松科苑14号楼变更为523808 广东省东莞市松山湖高新技术产业开发区科汇路1号中科院云计算中心19楼
- 2014-05-21
专利权的转移
登记生效日: 2014.04.23
专利权人由中国科学院计算技术研究所变更为国云科技股份有限公司
地址由100080 北京市海淀区中关村科学院南路6号变更为523808 广东省东莞市松山湖科技产业园区松科苑14号楼
- 2006-06-07
- 2005-01-05
- 2004-10-27
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |