著录项信息
专利名称 | 一种基于结构模型的汉字识别方法 |
申请号 | CN02125949.6 | 申请日期 | 2002-08-06 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2004-02-11 | 公开/公告号 | CN1474351 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 北京理工大学 | 申请人地址 | 北京市海淀区中关村南大街5号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 北京理工大学 | 当前权利人 | 北京理工大学 |
发明人 | 贾云得;刘峡壁 |
代理机构 | 北京理工大学专利中心 | 代理人 | 张利萍 |
摘要
本发明涉及基于结构模型的汉字识别方法,属于模式识别、人工智能和中文信息处理领域。本发明采用笔段和笔划两种基元分别建立两种描述汉字结构的数学模型笔段中心点模型和笔划关系矩阵模型,并建立了笔段中心点识别法和笔划关系矩阵识别法。将笔段中心点识别法和笔划矩阵识别法相结合,用笔段中心点识别法进行汉字识别粗分类,用笔划矩阵识别法进行汉字识别细分类,形成一套完整的汉字识别方法。该方法以统一的机制处理印刷体汉字识别和手写体汉字识别,既可用于脱机识别,也可用于联机识别,识别正确率高,性能稳定。
技术领域\n本发明涉及基于结构模型的汉字识别方法,要求保护的技术方 案属于模式识别、人工智能和中文信息处理领域。\n背景技术\n经过几十年的发展,汉字识别技术业已取得长足进步。但是, 无限制的手写体汉字识别,特别是脱机手写体汉字识别,距离人们 的期望还有一定的距离。为了解决脱机手写体汉字识别这一问题, 目前多采用统计方法和神经网络方法,通过对大量手写体汉字样本 的学习,达到适应汉字变形的目的。这种方法需要搜集海量样本和 花费巨大的学习时间,但效果并不十分理想。结构方法对变形的适 应能力强,没有搜集样本和进行学习的负担,但现有的结构方法虽 然在联机手写体汉字识别中取得相当成功,却难以运用到脱机汉字 识别领域中去。\n发明内容\n本发明所要解决的技术问题是提供一种有效识别汉字的结构方 法,该方法识别正确率高,稳定性好,既可用于手写体汉字识别, 也可用于印刷体汉字识别,既可用于脱机汉字识别,也可用于联机 汉字识别。\n用结构方法识别汉字的首要问题是建立汉字图像的结构模型。 本发明提供两种用于描述汉字结构的数学模型:笔段中心点模型和 笔划关系矩阵模型。\n笔段中心点模型以笔段为组成汉字的基元,通过笔段的类型和 位置来描述汉字。这里,笔段指汉字图像中与人们对横、竖、撇、 捺四种基本笔划(其它笔划可由这四种基本笔划组合而成)的认识 相符合的一个前景像素的集合。笔段中心点模型的表述如下:\n1)笔段类型\n根据笔段对应的方向向量,分为横、竖、撇、捺四种。\n2)笔段位置\n笔段位置由笔段的中点欧氏坐标来表示,称之为中心点坐标。该 坐标是在规范化汉字图像上求得的。\n3)模型构成\nH={(Xi,Yi,Ti)},i=1,2,…,N (1)\n其中,H表示汉字,Xi为第i个笔段的中心点横坐标值,Yi为第 i个笔段的中心点纵坐标值,Ti表示第i个笔段的类型,取值为横、 竖、撇、捺四种之一,N为组成汉字的笔段个数。\n公式(1)说明,如果一个规范化汉字图像在所有确定位置上(由 Xi和Yi确定)都有确定类型(由Ti确定)的笔段,则这个图像就是 某一汉字(由H确定),反之则不是。\n以笔段中心点模型为基础,本发明提供如下的汉字识别方法, 该方法被称为笔段中心点识别法。\n首先确定每个汉字类别所对应的标准笔段中心点模型。识别时, 计算待识别汉字所对应的笔段中心点模型与诸标准笔段中心点模型 之间的距离,以距离最小者所属类别或次小的前N个所属类别为识 别结果。距离的计算公式如下:\n\n其中,D(SP,RP)表示标准中心点集合与待识中心点集合之间的 距离,Q表示标准中心点集合与待识中心点集合之间可匹配的笔段 的最大个数,I表示标准中心点集合的笔段个数,J表示待识中心点 集合的笔段个数,J′表示从输入笔段集合中除去在匹配过程中被认 为是连笔的笔段以后剩下的笔段个数。(GiX,GiY)为标准中心点集合 的中心点坐标,(HjX,HjY)为待识中心点集合的中心点坐标,MSi 表示已经与标准中心点集合中前i-1个笔段相匹配的待识中心点集 合中的笔段子集,Simi(STi,PTj)表示标准中心点集合中第i个笔段 的类型与待识中心点集合中第j个笔段的类型的相似度,V为所允许 的笔段个数差异的阈值,T为给不能匹配的笔段所赋予的最大距离 的阈值,W为允许匹配的笔段之间的最小距离的阈值。\n笔段中心点识别法的具体步骤如下:\n(1)建立每一个汉字的标准笔段中心点集合;\n(2)将待识汉字规范化到标准大小,然后提取待识别汉字中 的所有笔段,形成待识别中心点集合;\n(3)按公式(2)计算每个标准中心点集合与待识别中心点集 合之间的距离,并以之作为每个标准汉字与待识别汉字 之间的距离;\n(4)在所有标准汉字中,取与待识别汉字之间距离最小者或 次小的前N个为识别结果。\n笔划关系矩阵模型以笔划为组成汉字的基元,通过笔划的类型 以及相互之间的位置关系来描述汉字。这里,笔划是指人们通常所 认识的汉字笔划。笔划关系矩阵模型的具体形式为:\n(1)笔划的类型\n见附图1\n(2)笔划之间的相互位置关系\n为了尽可能的表示一个汉字各种形态之间的共性而忽略那些有 可能产生剧烈变动的因素,我们将各笔划之间的相互位置关系模糊 化为六种:上、下、左、右、交叉、相连。\n(3)组合模型\n由于汉字图像是二维的,所以笔划及其相互位置关系用二维方 式来表达能更精确地反映其结构特征。我们采用矩阵的形式来描述:\n S1 S2 ..... SN-1 SN\nS1 R11 R12 ..... R1(N-1) R1N\nS2 R21 R22 ..... R2(N-1) R2N\n..... ..... .... ..... ...... .....\nSN-1 R(N-1)1 R(N-1)2 ..... R(N-1)(N-1) R(N-1)N\nSN RN1 RN2 ..... RN(N-1) RNN\n其中,S代表笔划,R代表关系,N代表笔划个数。S1~SN代 表行或列的意义,即笔划类型,R11~RNN为矩阵元素,表示与之对 应的行与列上两笔划之间的相互位置关系。\n以笔划关系矩阵模型为基础,本发明提供如下的汉字识别方法, 该方法被称为笔划关系矩阵识别法:\n首先确定每个汉字类别所对应的标准笔划关系矩阵模型。识别 时,计算待识别汉字所对应的笔段集合与诸标准笔划关系矩阵模型 之间的相似度。以相似度值最大者所属类别为识别结果。相似度值 的计算公式如下:\n\n其中,S(SP,RP)表示标准矩阵与待识矩阵之间的相似度, BN(SP)表示与标准矩阵对应的笔段个数,BN(RP)表示与待识矩阵 对应的笔段个数,BN(RP′)表示从待识矩阵对应的并且在匹配过程 中除去被认为是连笔的笔段之后剩下的笔段个数,SS(Sk,Tk)表示标 准矩阵中第k个笔划与待识矩阵中第k个笔划之间类型上的相似度 (k为i或j),RS(Rij,Gij)表示标准矩阵中第i行第j列元素与待识 矩阵中第i行第j列元素之间的相似度,V为所允许的笔段个数差异 的阈值。\n笔划关系矩阵识别法的具体步骤如下:\n(1)建立每一个汉字的标准笔划关系矩阵模型。\n(2)将待识别汉字规范化到标准大小,然后提取待识别汉字 中的所有笔段,形成输入笔段集合。\n(3)按公式(3)计算每个标准矩阵与输入笔段集合之间的相 似度,并以之作为每个标准汉字与待识别汉字之间的相 似度。\n(4)在所有标准汉字中,取与待识别汉字之间相似度最大的 一个为识别结果。\n笔段中心点识别法与笔划关系矩阵识别法各有特点,笔划关系 矩阵识别法更精确,笔段中心点识别法速度更快。因此,本发明提 供的汉字识别方法采用笔段中心点识别法进行粗分类,采用笔划关 系矩阵识别法进行细分类。同时,笔段中心点识别法对形状比较规 范的汉字进行识别的正确率也是令人满意的,因此,在实施本发明 识别形状比较规范的汉字时,可以单独采用笔段中心点识别法进行 细分类。\n本发明具有以下优点:\n1、本发明提供的汉字识别方法以统一的机制进行汉字识别, 既可用于脱机识别,也可用于脱机识别,既可用于手写体识别,也 可用于印刷体识别。\n2、本发明提供的汉字识别方法识别正确率高,对变形的适应 能力强,稳定性好。\n附图说明\n图1是笔划关系矩阵模型中的笔划类型图;\n图2是笔段中心点模型的示意图;\n图3是笔划关系矩阵模型的示意图;\n图4是汉字识别方法的总体框图\n图5是笔段中心识别法的汉字识别流程图;\n图6是笔划关系矩阵识别法的汉字识别流程图;\n具体实施方式\n本发明可实施于需要进行汉字识别的各种场合,优选方式为联 机手写体汉字识别系统及装置,脱机印刷体汉字识别系统及装置, 脱机手写体汉字识别系统及装置。实施例,在GB2312-80规定的6763 个汉字范围内,对无限制自由手写汉字进行识别,笔段中心点分类 器识别前十位候选字的正确率为99%以上,平均识别速度为1秒/字, 笔划关系矩阵分类器的识别正确率为91.2%以上,平均识别速度为 0.2秒/字。
法律信息
- 2009-10-07
专利权的终止(未缴年费专利权终止)
专利权的终止(未缴年费专利权终止)授权公告日:2005.1.26
- 2005-01-26
- 2004-04-21
- 2004-02-11
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |