著录项信息
专利名称 | 啤酒瓶盖激光字符的定位识别方法 |
申请号 | CN201210395549.6 | 申请日期 | 2012-10-17 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2013-02-27 | 公开/公告号 | CN102945368A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/20 | IPC分类号 | G;0;6;K;9;/;2;0;;;G;0;6;K;9;/;5;4查看分类表>
|
申请人 | 西安理工大学 | 申请人地址 | 陕西省西安市金花南路5号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 西安理工大学 | 当前权利人 | 西安理工大学 |
发明人 | 武吉梅;李晶 |
代理机构 | 西安弘理专利事务所 | 代理人 | 李娜 |
摘要
本发明公开了一种啤酒瓶盖激光字符的定位识别方法,包括以下步骤:步骤1、字符定位,包括粗定位和精定位,对定位符图像进行二值化、腐蚀膨胀、边缘检测、轮廓跟踪和霍夫变换处理,找到定位符“A”的两条边所在的直线的角度,计算出字符旋转的角度;找到瓶盖中心的坐标,将瓶盖中心平移到原始瓶盖图像的中心,按计算出的字符旋转角度将瓶盖图像转正,重新定位到字符。步骤2、字符分割和识别,字符识别包括提取13特征、提取投影统计特征、以及提取粗网格特征,最后在该三种字符特征的基础上,利用模板匹配法对字符进行匹配识别即成。本发明的方法,针对背景复杂、光照不均的瓶盖字符图像,实现了任意角度旋转的啤酒瓶盖激光字符定位。
1.一种啤酒瓶盖激光字符的定位识别方法,其特征在于,按照以下步骤实施:
步骤1、字符定位,包括粗定位和精定位,
1.1)图像预处理
在生产线上采集到分辨率为640×480的啤酒瓶盖原始图像,对该原始图像进行中值滤波的处理;
1.2)粗定位
把定位符模板图像的分辨率降低,在低分辨率的定位符模板图像上取以图像中心为圆心,半径为r的圆内的像素,设共有H个像素,按逐列连接的方法将H个像素构成一个H维列向量,放入数组b的第一列,以步长Δθ旋转模板,用旋转后的H个像素构成b的第二列,依次旋转直至转过360度,最终生成H×(2π/Δθ)大小的数组b,
把原始瓶盖图像降低分辨率,在瓶盖区域内部自上而下、自左而右搜索,在低分辨率瓶盖图像上的点(x,y)处取半径为r的圆内的像素,用同样的方法生成一个H维矢量a,矢量a与数组b逐列相关,记录下相关系数以及此时的位置信息,
移动到下一个位置,生成新的a,重复计算相关系数的步骤,直至搜索完瓶盖图像范围内所有的像素点,将各位置处的相关系数排序,最大相关系数出现的位置就是定位符的位置;
1.3)精定位
截取步骤1.2)中定位得到的定位符所在区域的图像,图像尺寸设置为56×56,首先用OTSU方法对定位符图像进行二值化处理,
统计此时定位符二值化图像中黑像素点的个数,当二值化后黑像素点个数在[200,900]范围内时定位符“A”的二值化效果最好,如果黑点个数不在这个范围内,则需要对定位符图像重新进行二值化,
统计出定位符二值化图像上黑色像素点的个数,从而对定位符图像进行膨胀或腐蚀处理,当黑色像素点个数大于580时,需要对图像进行腐蚀处理,当黑色像素点个数小于500时,需要对定位符图像进行膨胀处理,
采用水平投影法和垂直投影法找到定位符的边界以去除多余的噪声点,
采用Gauss-Laplace算子对定位符图像进行边缘检测;
对定位符边缘检测图像用基于8连通区域的轮廓跟踪进行处理;
通过霍夫变换找到定位符图像中两条最长的直线与水平线的夹角,即定位符A两个边所在直线的角度,用以计算字符的旋转角度;
通过霍夫变换得到定位符A两边所在直线的角度,计算出两边夹角的中线的角度,当中线旋转至垂直时定位符即视为转正了,此时计算出的旋转角度就是字符的旋转角度;但是,无论定位符A是正是反,输出的两条边的角度都是一样的,仅仅按照一种情况计算出的旋转角度对瓶盖图像进行角度校正,有可能得到的校正后的瓶盖图像是倒的,判断出计算角度需调整的情况,将原来的旋转角度加上180度,重新旋转;
用计算出的角度对原始瓶盖图像做旋转校正,在旋转校正的过程中进行了插值计算,因而校正后定位符的位置改变了,不再是粗定位的位置,需要重新对定位符进行定位,具体步骤如下:①对粗定位找到的定位符所在区域二值化;②将瓶盖中心平移到原始瓶盖图像的中心;③将此时图像中心的部分按照之前计算出的角度旋转;④因为定位符所在区域被二值化了,在包含定位符的区域里存在大量灰度值为0和255的像素点,在旋转校正后的瓶盖图像的左半边图像范围内搜索定位符,如果该区域内像素值为0或255的点的总个数大于预先设定的阈值,该区域就是定位符所在的区域,字符图像就在定位符的后面,把字符图像截取下来,即完成了字符定位的操作;
步骤2、字符分割和识别
2.1)字符分割
字符分割前先对字符图像进行中值滤波以减弱噪声,
从字符图像的左边截取一个图像区域,第一个字符包含在里面,对这个区域二值化,经后续的投影去噪找到字符的边界,分割出第一个字符;再以第一个字符的右边界为左基准,向右下方截取另一个图像区域,第二个字符包含在里面,再对这个区域二值化、投影找到字符边界,分割出第二个字符,以此类推,用同样的方法把字符图像中的5个字符依次分割出来;
对分割出的单个字符归一化,把字符都统一为24×40大小;
2.2)字符识别
提取出单个字符的13特征、投影统计特征和粗网格特征,把单个字符的特征与0到9的模板特征进行匹配,识别出字符,
待识别的字符是ocr-a字体的10个数字,从大量的单个字符中选择笔划饱满、效果好的单个字符作为模板,字符大小均为归一化后的尺寸,
字符特征提取包括以下步骤:
2.2.1)提取13特征;
2.2.2)提取投影统计特征,对待识别的字符图像自左向右进行逐行的扫描,统计出每行黑色像素点的个数,然后自上而下进行逐列的扫描,统计出每列的黑色像素点的个数,将统计出的结果作为字符的特征向量;
2.2.3)提取粗网格特征,把待识别的归一化数字字符图像按照4×4分块,统计出每个大网格中的黑色像素点的个数,将统计出的结果作为字符的特征向量;
得到上述的三种特征后,就得到了归一化字符图像的特征,最后在该三种字符特征的基础上,利用模板匹配法对字符进行匹配识别,即成。
2.根据权利要求1所述的啤酒瓶盖激光字符的定位识别方法,其特征在于:所述的步骤2.1)中,由于前一步骤得到的二值化的区域比较大,需要缩小范围,通过对截取的单个字符二值化图像进行投影初步确定单个字符所在的区域;
通过投影已经初步确定了单个字符所在的区域,对这个小区域重新二值化;再对这个小区域重新进行投影,去除噪声点并确定单个字符的边界;
进行中值滤波处理。
3.根据权利要求1所述的啤酒瓶盖激光字符的定位识别方法,其特征在于:所述的步骤2.2.1)中的13特征提取法,具体步骤如下:
首先把字符平均地分成8个区域,分别统计出这8个区域内的黑色像素点的个数,这样就得到8个特征,并把这些特征按照从上到下、从左到右的顺序依次地记作I(1)~I(8),然后统计出竖直方向中间的两列以及水平方向中间两行上黑色像素点个数作为4个特征,依次记作I(9)~I(12),最后统计出字符图像中所有黑色像素点的个数作为字符的第13个特征。
啤酒瓶盖激光字符的定位识别方法\n技术领域\n[0001] 本发明属于电子监管码字符识别技术领域,涉及一种啤酒瓶盖激光字符的定位识别方法。\n背景技术\n[0002] 近年来,物联网印刷包装领域中的电子监管码字符识别的研究取得了大量的研究成果,这些成果被广泛用于车牌识别、印刷包装符号识别等场合。目前的字符识别条件下,由于被识别的图像质量一般较好,目标区域对比度大,目标静止,并且只会出现小角度的旋转,噪声干扰小,识别准确率高。\n[0003] 啤酒瓶盖激光字符的定位是用图像匹配实现的。啤酒瓶盖激光字符是由两部分组成,即固定不变的字符“A”(被称为定位符)和五位变动的数字字符组成。由于定位符是不变的字符,用定位符的模板通过相关系数法进行粗匹配,找到定位符的位置,再对定位符图像进行精匹配,以找到图像旋转角度,转正图像,从而定位到具体的数字字符。\n[0004] 但是在啤酒瓶盖激光字符识别中,瓶盖图像是在生产线运动过程中采集的,因而字符图像不会出现在固定的位置上,并且字符图像会有任意角度的旋转,给字符定位和识别带来了困难。\n[0005] 因此,研究抗任意角度旋转的字符定位识别方法,对于解决类似啤酒生产流通中的电子监管和物流追溯的管理难题具有重大的现实意义,是字符识别技术走向实用化必须解决的技术问题。\n发明内容\n[0006] 本发明的目的是提供一种啤酒瓶盖激光字符的定位识别方法,解决了现有技术中在啤酒瓶盖任意角度旋转时,瓶盖上的字符难以识别的问题。\n[0007] 本发明所采用的技术方案是,一种啤酒瓶盖激光字符的定位识别方法,按照以下步骤实施:\n[0008] 步骤1、字符定位,包括粗定位和精定位,\n[0009] 1.1)图像预处理\n[0010] 在生产线上采集到分辨率为640×480的啤酒瓶盖原始图像,在此,图像预处理是指对图像进行中值滤波,\n[0011] 1.2)粗定位\n[0012] 把定位符模板图像的分辨率降低,在低分辨率的定位符模板图像上取以图像中心为圆心,半径为r的圆内的像素,设共有H个像素,按逐列连接的方法将H个像素构成一个H维列向量,放入数组b的第一列,以步长Δθ旋转模板,用旋转后的H个像素构成b的第二列,依次旋转直至转过360度,最终生成H×(2π/Δθ)大小的数组b,\n[0013] 把原始瓶盖图像降低分辨率,在瓶盖区域内部自上而下、自左而右搜索,在低分辨率瓶盖图像上的点(x,y)处取半径为r的圆内的像素,用同样的方法生成一个H维矢量a,[0014] 矢量a与数组b逐列相关,记录下相关系数以及此时的位置信息,[0015] 移动到下一个位置,生成新的a,重复计算相关系数的步骤,直至搜索完瓶盖图像范围内所有的像素点,将各位置处的相关系数排序,最大相关系数出现的位置就是定位符的位置,\n[0016] 1.3)精定位\n[0017] 截取步骤1.2)中定位得到的定位符所在区域的图像,图像尺寸为56×56,首先用OTSU方法先对定位符图像进行二值化处理,统计此时定位符二值化图像中黑像素点的个数,当二值化后黑像素点个数在[200,900]范围内时定位符“A”的二值化效果最好,如果黑点个数不在这个范围内,则需要对定位符图像重新进行二值化,\n[0018] 统计出定位符二值化图像上黑色像素点的个数,从而对定位符图像进行膨胀或腐蚀处理,当黑色像素点个数大于580时,需要对图像进行腐蚀处理,当黑色像素点个数小于\n500时,需要对定位符图像进行膨胀处理,\n[0019] 采用水平投影法和垂直投影法找到定位符的边界以去除多余的噪声点,[0020] 采用Gauss-Laplace算子对定位符图像进行边缘检测;\n[0021] 对定位符边缘检测图像用基于8连通区域的轮廓跟踪进行处理;\n[0022] 通过霍夫变换找到定位符图像中两条最长的直线与水平线的夹角,即定位符A两个边所在直线的角度,用以计算字符的旋转角度;\n[0023] 通过霍夫变换得到定位符A两边所在直线的角度,计算出两边夹角的中线的角度,当中线旋转至垂直时定位符即视为转正了,此时计算出的旋转角度就是字符的旋转角度;但是,无论定位符A是正是反,输出的两条边的角度都是一样的,仅仅按照一种情况计算出的旋转角度对瓶盖图像进行角度校正,有可能得到的校正后的瓶盖图像是倒的,判断出计算角度需调整的情况,将原来的旋转角度加上180度,重新旋转;\n[0024] 用计算出的角度对原始瓶盖图像做旋转校正,在旋转校正的过程中进行了插值计算,因而校正后定位符的位置改变了,不再是粗定位的位置,需要重新对定位符进行定位,具体步骤如下:①对粗定位找到的定位符所在区域二值化;②将瓶盖中心平移到原始瓶盖图像的中心;③将此时图像中心的部分按照之前计算出的角度旋转;④因为定位符所在区域被二值化了,在包含定位符的区域里应该存在大量灰度值为0和255的像素点,在旋转校正后的瓶盖图像的左半边图像范围内搜索定位符,如果在较大的范围内像素值为0或255的点的总个数大于预先设定的阈值130,该区域就是定位符所在的区域,[0025] 字符图像就在定位符的后面,把字符图像截取下来,就完成了字符定位的操作;\n[0026] 步骤2、字符分割和识别\n[0027] 2.1)字符分割\n[0028] 字符分割前先对字符图像中值滤波以减弱噪声,\n[0029] 从字符图像的左边截取较大范围的图像区域,第一个字符包含在里面,对这个区域二值化,经后续的投影去噪找到字符的边界,分割出第一个字符;再以第一个字符的右边界为左基准,向右下方截取较大范围的区域,第二个字符包含在里面,再对这个区域二值化、投影找到字符边界,分割出第二个字符,以此类推,用同样的方法把字符图像中的5个字符依次分割出来;\n[0030] 对分割出的单个字符归一化,把字符都统一为24×40大小;\n[0031] 2.2)字符识别\n[0032] 提取出单个字符的13特征、投影统计特征和粗网格特征,把单个字符的特征与0到9的模板特征进行匹配,识别出字符,\n[0033] 待识别的字符是ocr-a字体的10个数字,从大量的单个字符中选择笔划饱满、效果好的单个字符作为模板,字符大小均为归一化后的尺寸,\n[0034] 字符特征提取包括以下步骤:\n[0035] 2.2.1)提取13特征;\n[0036] 2.2.2)提取投影统计特征,对待识别的字符图像自左向右进行逐行的扫描,统计出每行黑色像素点的个数,然后自上而下进行逐列的扫描,统计出每列的黑色像素点的个数,将统计出的结果作为字符的特征向量;\n[0037] 2.2.3)提取粗网格特征,把待识别的归一化数字字符图像按照4×4分块,统计出每个大网格中的黑色像素点的个数,将统计出的结果作为字符的特征向量;\n[0038] 得到上述的三种特征后,就得到了归一化字符图像的特征,最后在该三种字符特征的基础上,利用模板匹配法对字符进行匹配识别,即成。\n[0039] 本发明的有益效果是,物联网印刷包装电子监管码字符定位识别,针对背景复杂、光照不均的瓶盖字符图像,有效地分割了字符,能够抗任意角度旋转,对图像清晰度影响不大,保证了字符的准确定位,实现了任意角度旋转的啤酒瓶盖激光字符定位。\n附图说明\n[0040] 图1是本发明方法中的原始瓶盖图像;\n[0041] 图2是本发明方法中的定位符模板图像;\n[0042] 图3是本发明方法中的粗定位图像;\n[0043] 图4是本发明方法中的定位符图像,其中的图4a是需腐蚀的定位符图像,图4b是需膨胀的定位符图像,图4c是图4a腐蚀后的图像,图4d是图4b膨胀后的图像;\n[0044] 图5是本发明方法中的定位符腐蚀膨胀图像,其中的图5a是定位符腐蚀图像,图\n5b是水平投影图像,图5c是垂直投影图像,图5d是定位符裁切图像;\n[0045] 图6是本发明方法中的定位符投影图像,其中的图6a是边缘检测前图像,图6b是边缘检测图像;\n[0046] 图7是本发明方法中的定位符边缘检测图像,其中的图7a是轮廓跟踪前图像,图\n7b是轮廓跟踪图像;\n[0047] 图8是本发明方法中的定位符轮廓跟踪图像;\n[0048] 图9是本发明方法中的定位符霍夫变换图像,其中的图9a是定位符一的霍夫变换图像,图9b是定位符一的旋转校正图像,图9c是歧义问题图像,图9d是定位符二的霍夫变换图像,图9e是定位符二的旋转校正图像,图9f是定位符图像二的重新旋转校正图像;\n[0049] 图10是本发明方法中的旋转角度计算图像,其中的图10a是定位符区域二值化图像,图10b是瓶盖平移图像,图10c是瓶盖旋转校正图像,图10d是字符图像;\n[0050] 图11是本发明方法中的定位符重新定位图像;\n[0051] 图12是本发明方法中的单个字符二值化图像;\n[0052] 图13是本发明方法中的单个字符投影图像,其中的图13a是分割出的字符图像,图13b是字符滤波图像。\n具体实施方式\n[0053] 本发明啤酒瓶盖激光字符的定位识别方法的工作原理是:啤酒瓶盖激光码由两部分组成,即规定的特殊字符“A”(被称为定位符)和五位变动的数字字符,因此所有的字符定位包括粗定位和精定位两部分,粗定位定位到定位符的位置,而精定位通过定位符图像找到图像旋转角度,将图像转正并定位到字符。定位符模板的信息记录着以一定步长旋转时模板旋转到各个角度处定位符模板的灰度信息,用它和待匹配瓶盖图像做匹配,因而能够实现任意角度旋转的字符识别。\n[0054] 粗定位的工作原理是:把瓶盖图像和定位符模板图像的分辨率降低,以一定的步长旋转定位符模板图像,把每个角度的模板灰度信息存入数组中;在低分辨率的瓶盖图像上计算瓶盖内每个位置周围的灰度信息和定位符模板信息的相关系数,相关系数最大的位置就是定位符所在的区域;根据低分辨率上定位符的坐标计算出原图上定位符的坐标。\n[0055] 精定位的工作原理是:截取定位符所在区域的图像,对定位符图像二值化、腐蚀膨胀、边缘检测、轮廓跟踪和霍夫变换,找到字符旋转的角度,这个角度就是图像需要旋转的角度;找到图像中瓶盖中心的坐标,将瓶盖中心平移到图像的中心,图像转正,重新定位到字符,将字符图像显示在界面上,从而实现了任意角度旋转的字符定位。\n[0056] 本发明的啤酒瓶盖激光字符的定位识别方法,按照以下步骤实施:\n[0057] 步骤1、字符定位,包括粗定位和精定位。\n[0058] 1.1)图像预处理\n[0059] 在生产线上采集到分辨率为640×480的啤酒瓶盖原始图像,这里的图像预处理是指对图像进行中值滤波,\n[0060] 图1是原始瓶盖图像,图2是定位符模板图像。\n[0061] 1.2)粗定位\n[0062] 把原始瓶盖图像和定位符模板图像的分辨率降低,以一定的步长旋转定位符模板图像,把每次旋转后的模板灰度信息存入数组中。在低分辨率的瓶盖图像上计算瓶盖内每个位置周围的灰度信息和定位符模板图像信息的相关系数,相关系数最大的位置就是定位符所在的区域,再根据低分辨率上定位符的坐标计算出原始瓶盖图像上定位符的坐标,具体过程如下:\n[0063] 把定位符模板图像的分辨率降低,在低分辨率的定位符模板图像上取以图像中心为圆心,半径为r的圆内的像素,设共有H个像素,按逐列连接的方法将H个像素构成一个H维列向量,放入数组b的第一列,以步长Δθ旋转模板,用旋转后的H个像素构成b的第二列,依次旋转直至转过360度,最终生成H×(2π/Δθ)大小的数组b,\n[0064] 把原始瓶盖图像降低分辨率,在瓶盖区域内部自上而下、自左而右搜索,在低分辨率瓶盖图像上的点(x,y)处取半径为r的圆内的像素,用同样的方法生成一个H维矢量a,[0065] 矢量a与数组b逐列相关,记录下相关系数以及此时的位置信息,[0066] 移动到下一个位置,生成新的a,重复计算相关系数的步骤,直至搜索完瓶盖图像范围内所有的像素点,将各位置处的相关系数排序,最大相关系数出现的位置就是定位符的位置,\n[0067] 图3是粗定位得到的图像。\n[0068] 1.3)精定位\n[0069] 截取定位符所在区域的图像,对定位符图像进行二值化、腐蚀膨胀、边缘检测、轮廓跟踪和霍夫变换处理,找到定位符“A”的两条边所在的直线的角度,计算出字符旋转的角度;找到瓶盖中心的坐标,将瓶盖中心平移到原始瓶盖图像的中心,按计算出的字符旋转角度将瓶盖图像转正,重新定位到字符,具体过程如下:\n[0070] 截取步骤1.2)中定位得到的定位符所在区域的图像,图像尺寸为56×56,首先用OTSU方法先对定位符图像进行二值化处理,统计此时定位符二值化图像中黑像素点的个数,当二值化后黑像素点个数在[200,900]范围内时定位符“A”的二值化效果最好,如果黑点个数不在这个范围内需要对定位符图像重新进行二值化。\n[0071] 统计出定位符二值化图像上黑色像素点的个数,从而对定位符图像进行膨胀或腐蚀处理。当黑色像素点个数大于580时,需要对图像进行腐蚀处理,当黑色像素点个数小于\n500时,需要对定位符图像进行膨胀处理。\n[0072] 参照图4是定位符腐蚀膨胀图像,其中的图4a是需腐蚀的定位符图像,图4b是需膨胀的定位符图像,图4c是图4a腐蚀后的图像,图4d是图4b膨胀后的图像。\n[0073] 采用水平投影法和垂直投影法找到定位符的边界以去除多余的噪声点,有时仅仅凭借水平投影和垂直投影也不能完全去除出定位符图像的四个角上的噪声(如图5a右上角黑色像素部分所示),就需要通过把四个角上的像素点直接变白来消除这类噪声;;\n[0074] 参照图5是定位符投影裁切图像,其中的图5a是定位符腐蚀图像,图5b是水平投影图像,图5c是垂直投影图像,图5d是定位符裁切图像。\n[0075] 采用Gauss-Laplace算子对定位符图像进行边缘检测;\n[0076] 参照图6是定位符边缘检测图像,其中的图6a是边缘检测前图像,图6b是边缘检测图像。\n[0077] 对定位符边缘检测图像用基于8连通区域的轮廓跟踪进行处理;\n[0078] 参照图7是定位符轮廓跟踪图像,其中的图7a是轮廓跟踪前图像,图7b是轮廓跟踪图像。\n[0079] 通过霍夫变换找到定位符图像中两条最长的直线与水平线的夹角,即定位符A两个边所在直线的角度,用以计算字符的旋转角度;\n[0080] 图8是定位符霍夫变换图像,参照图9a是定位符一霍夫变换图像,图9b是定位符一旋转校正图像。\n[0081] 通过霍夫变换得到定位符A两边所在直线的角度,计算出两边夹角的中线的角度,当中线旋转至垂直时定位符即视为转正了,此时计算出的旋转角度就是字符的旋转角度。但是,无论定位符A是正是反,输出的两条边的角度都是一样的(如图9c所示是歧义问题图像),仅仅按照一种情况计算出的旋转角度对瓶盖图像进行角度校正,有可能得到的校正后的瓶盖图像是倒的,判断出计算角度需调整的情况,将原来的旋转角度加上180度,重新旋转,参照,图9d是定位符二霍夫变换图像,图9e是定位符二旋转校正图像,图9f是定位符图像二重新旋转校正图像。\n[0082] 用计算出的角度对原始瓶盖图像做旋转校正,在旋转校正的过程中进行了插值计算,因而校正后定位符的位置改变了,不再是粗定位的位置,需要重新对定位符进行定位,具体步骤如下:①对粗定位找到的定位符所在区域二值化(如图10a所示是定位符区域二值化图像);②将瓶盖中心平移到原始瓶盖图像的中心(如图10b所示是瓶盖平移图像);③将此时图像中心的部分按照之前计算出的角度旋转(如图10c所示是瓶盖旋转校正图像);\n④因为定位符所在区域被二值化了,在包含定位符的区域里应该存在大量灰度值为0和\n255的像素点,在旋转校正后的瓶盖图像(如图10c所示)的左半边图像范围内搜索定位符,如果在较大的范围内像素值为0或255的点的总个数大于预先设定的阈值(优选130的数值),该区域就是定位符所在的区域,字符图像就在定位符的后面,把字符图像截取下来,就完成了字符定位的操作如图10d所示是字符图像。\n[0083] 步骤2、字符分割和识别\n[0084] 2.1)字符分割\n[0085] 从定位到的含有五个字符的字符图像(如图10d所示)上截取包含第一个字符的区域,对它进行二值化,通过投影找到单个字符边界,分割出单个字符,从第一个字符后面用同样的方法截取出剩下的4个字符,对分割出的单个字符滤波和归一化,具体步骤如下:\n[0086] 由于字符定位过程中的原瓶盖图像发生了旋转,这个过程会产生一定的噪声,因此,字符分割前先对字符图像中值滤波以减弱噪声,\n[0087] 先从字符图像的左边截取较大范围的图像区域,第一个字符包含在里面,对这个区域二值化(如图11所示),经后续的投影去噪找到字符的边界,分割出第一个字符;再以第一个字符的右边界为左基准,向右下方截取较大范围的区域,第二个字符包含在里面,再对这个区域二值化、投影找到字符边界,分割出第二个字符,以此类推,用同样的方法把字符图像中的5个字符依次分割出来。\n[0088] 图11是单个字符二值化图像。\n[0089] 由于上面二值化的区域比较大,需要缩小范围,通过对截取的单个字符二值化图像进行投影初步确定单个字符所在的区域(如图12所示)。\n[0090] 图12是单个字符投影图像。\n[0091] 或者,由于瓶盖背景复杂、光照不均等问题,有时在较大的范围内进行二值化,其处理效果仍然不是很理想,需要尽量缩小范围再重新二值化以减弱周边像素的干扰;通过投影已经初步确定了单个字符所在的区域,对这个小区域重新二值化;再对这个小区域重新进行投影,去除噪声点并确定单个字符的边界。\n[0092] 或者,二值化后分割出的字符图像,如图13a所示是分割出的字符图像,有时毛刺比较多,需要进行中值滤波处理使笔划圆滑便于识别,如图13b所示是字符滤波图像。\n[0093] 至此,对分割出的单个字符归一化,把字符都统一为24×40大小。\n[0094] 2.2)字符识别\n[0095] 提取出单个字符的13特征、投影统计特征和粗网格特征,把单个字符的特征与0到9的模板特征进行匹配,识别出字符,\n[0096] 待识别的字符是ocr-a字体的10个数字,从大量的单个字符中选择笔划饱满、效果好的单个字符作为模板,字符大小均为归一化后的尺寸。\n[0097] 字符特征提取包括以下步骤:\n[0098] 2.2.1)提取13特征\n[0099] 所述的13特征提取法,是一种具有较强适应性的方法,具体步骤如下:\n[0100] 首先把字符平均地分成8个区域,分别统计出这8个区域内的黑色像素点的个数,这样就得到8个特征,并把这些特征按照从上到下、从左到右的顺序依次地记作I(1)~I(8),然后统计出竖直方向中间的两列以及水平方向中间两行上黑色像素点个数作为4个特征,依次记作I(9)~I(12),最后统计出字符图像中所有黑色像素点的个数作为字符的第13个特征;\n[0101] 2.2.2)提取投影统计特征\n[0102] 对待识别的字符图像自左向右进行逐行的扫描,统计出每行黑色像素点的个数,然后自上而下进行逐列的扫描,统计出每列的黑色像素点的个数,将统计出的结果作为字符的特征向量;\n[0103] 2.2.3)提取粗网格特征\n[0104] 把待识别的归一化数字字符图像按照4×4分块,统计出每个大网格中的黑色像素点的个数,将统计出的结果作为字符的特征向量;\n[0105] 得到上述的三种特征后,就得到了归一化字符图像的特征,最后在该三种字符特征的基础上,利用模板匹配法对字符进行匹配识别,即成。
法律信息
- 2021-09-24
未缴年费专利权终止
IPC(主分类): G06K 9/20
专利号: ZL 201210395549.6
申请日: 2012.10.17
授权公告日: 2015.04.22
- 2015-04-22
- 2013-04-03
实质审查的生效
IPC(主分类): G06K 9/20
专利申请号: 201210395549.6
申请日: 2012.10.17
- 2013-02-27
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2012-08-01
|
2012-03-29
| | |
2
| |
2012-08-15
|
2012-02-28
| | |
3
| |
2012-07-25
|
2012-02-17
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |