著录项信息
专利名称 | 判别图像中文本颜色极性的方法及装置 |
申请号 | CN201110080923.9 | 申请日期 | 2011-03-31 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2011-07-13 | 公开/公告号 | CN102122347A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/20 | IPC分类号 | G;0;6;K;9;/;2;0;;;G;0;6;K;9;/;3;8;;;G;0;6;K;9;/;4;0;;;G;0;6;K;9;/;4;6查看分类表>
|
申请人 | 汉王科技股份有限公司 | 申请人地址 | 北京市海淀区东北旺西路8号5号楼3层356室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 北京汉王智远科技有限公司 | 当前权利人 | 北京汉王智远科技有限公司 |
发明人 | 黄磊;王修飞;刘昌平 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本发明公开了一种判别图像中文本颜色极性的方法,属于图像处理领域。该方法包括:对原始图像进行预处理,得到预处理后的文本图像;从预处理后的文本图像中提取字符笔画特征,获得笔画图;对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图;根据获得的笔画图和滤噪二值笔画图计算原始图像的笔画强度,根据笔画强度判别原始图像中文本颜色的极性。本发明还公开了一种判别图像中文本颜色极性的装置。本发明的方法及装置利用文本的笔画信息,可有效地消除复杂背景所带来的干扰,利用文本正向、负向笔画图中的笔画强度来度量图像中文本的颜色极性,可以有效地判断出图像的文本颜色的极性,且计算简单方便。
1.一种判别图像中文本颜色极性的方法,其特征在于,包括:
对原始图像进行预处理,得到预处理后的文本图像;
采用笔画提取算子从预处理后的文本图像中提取字符笔画特征,获得笔画图,所述笔画图包括正向笔画图和负向笔画图;
对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图,所述滤噪二值笔画图包括滤噪正向二值笔画图和滤噪负向二值笔画图;
根据笔画图和滤噪二值笔画图计算原始图像的笔画强度,根据笔画强度判别原始图像中文本颜色的极性;具体包括:
通过公式 计算原始图像的正向笔画强度,其中SP为原始图像的正向
笔画图, 为所述SP对应的滤噪正向二值笔画图;
通过公式 计算原始图像的负向笔画强度,其中SN为原始图像的负向
笔画图, 为所述SN对应的滤噪负向二值笔画图;
如果正向笔画强度EP大于负向笔画强度EN,则判定原始图像中字符为亮底暗字;否则,判定原始图像中字符为暗底亮字。
2.根据权利要求1所述的方法,其特征在于,所述采用笔画提取算子从预处理后的文本图像中提取字符笔画特征,获得笔画图,包括:
从预处理后的文本图像中提取笔画特征,获得原始图像的正向笔画图;
将预处理后的图像进行反色,得到其反色图像,并从中提取笔画特征,获得原始图像的负向笔画图。
3.根据权利要求1所述的方法,其特征在于,所述对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图,包括:
对笔画图进行二值化处理,获得包括正向二值笔画图和负向二值笔画图的二值笔画图;
根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。
4.根据权利要求3所述的方法,其特征在于,所述根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图,包括:
第一步,确定迭代公式
所述迭代公式包括:迭代变量i、第i步滤噪二值笔画图的筛选结果 中点p的像素值 第i-1步滤噪二值笔画图的筛选结果 中点p的像素值 笔画图S
及其中点p的像素值S(p)、μi和δi,其中:
μi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图 中像素值为
255的点所对应区域的均值,其计算公式为:
δi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图 中像素值为
255的点所对应区域的标准差,其计算公式为:
所述,N为第i-1步滤噪二值笔画图 中像素值为255的点的个数;
第二步,初始化迭代变量;
第三步,计算并判断所述均值和标准差是否满足|μi-μi-1|小于第一给定阈值,并且|δi-δi-1|小于第二给定阈值的迭代终止条件,若满足,则迭代完成;否则,更新迭代变量,循环迭代;
第四步,得到滤噪二值笔画图。
5.根据权利要求1所述的方法,其特征在于,所述对原始图像进行预处理,得到预处理后的文本图像,包括:
当原始图像的原始宽度大于原始高度的二倍时,确定原始图像中的文本为横向排列文本,将原始图像的原始高度归一化为预定尺寸,将原始宽度按照原始高度和原始宽度的比值等比例缩放,得到预处理后的文本图像;
当原始图像的原始宽度不大于原始高度的二倍时,确定原始图像中的文本为纵向排列文本,将原始图像的原始宽度归一化为预定尺寸,将原始高度按原始高度和原始宽度的比值等比例缩放,得到预处理后的文本图像。
6.一种判别图像中文本颜色极性的装置,其特征在于,包括:
预处理模块,用于对原始图像进行预处理,得到预处理后的文本图像;
提取模块,用于采用笔画提取算子从预处理后的文本图像中提取字符笔画特征,获得笔画图,所述笔画图包括正向笔画图和负向笔画图;
笔画图处理模块,用于对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图,所述滤噪二值笔画图包括滤噪正向二值笔画图和滤噪负向二值笔画图;
颜色极性判断模块,用于根据笔画图和滤噪二值笔画图计算原始图像的笔画强度,根据笔画强度判别原始图像中文本颜色的极性;所述颜色极性判断模块进一步包括:
笔画强度计算单元,用于通过公式 计算原始图像的正向笔画强度,
其中SP为原始图像的正向笔画图, 为所述SP对应的滤噪正向二值笔画图;通过公式计算原始图像的负向笔画强度,其中SN为原始图像的负向笔画图, 为
所述SN对应的滤噪负向二值笔画图;
颜色极性判断单元,用于当正向笔画强度EP大于负向笔画强度EN,则判定原始图像中字符为亮底暗字;否则,判定原始图像中字符为暗底亮字。
7.根据权利要求6所述的装置,其特征在于,所述笔画图处理模块进一步包括:
二值化单元,用于对笔画图进行二值化处理,获得包括正向二值笔画图和负向二值笔画图的二值笔画图;
噪声过滤单元,用于根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。
8.根据权利要求7所述的装置,其特征在于,所述噪声过滤单元进一步包括:
公式确定子单元,用于确定迭代公式
所述迭代公式包括:迭代变量i、第i步滤噪二值笔画图的筛选结果 中点p的像素值 第i-1步滤噪二值笔画图的筛选结果 中点p的像素值 笔画图S
及其中点p的像素值S(p)、μi和δi,其中:
μi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图 中像素值为
255的点所对应区域的均值,其计算公式为:
δi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图 中像素值为
255的点所对应区域的标准差,其计算公式为:
所述,N为第i-1步滤噪二值笔画图 中像素值为255的点的个数;
初始化子单元,用于初始化迭代变量;
迭代判断子单元,用于计算并判断所述均值和标准差是否满足|μi-μi-1|小于第一给定阈值,并且|δi-δi-1|小于第二给定阈值的迭代终止条件,若满足,则迭代完成;否则,更新迭代变量,循环迭代;
生成子单元,用于得到滤噪二值笔画图。
判别图像中文本颜色极性的方法及装置\n技术领域\n[0001] 本发明涉及图像处理领域,特别涉及一种判别图像中文本颜色极性的方法及装置。\n背景技术\n[0002] 所谓文本的极性,可以分为正向文本和负向文本,其中,正向文本的图像即表示亮底暗字的情形,负向文本的图像即表示暗底亮字的情形。图像中文本颜色极性的判别是视频和文本图像中字符识别处理过程中比较关键的一步,目前的OCR引擎大部分是针对暗底亮字(即背景为黑色,字符为白色)的文本图像进行识别,若文本图像的颜色极性判断错误,则将直接导致错误的识别结果。\n[0003] 已有的文本图像颜色极性判别方法主要是基于文本的边缘特征。如现有技术中的方法(参见参考文献【1】),通过计算白边缘和黑边缘点的数目,并结合四个统计分类结果构造的分类器进行判断的。现有技术中还有的方法(参见参考文献【2】),通过先计算文字区域中间0.35h行像素的平均值m1,再计算上下边缘共0.35h行像素的平均值m2,如果m1>m2,则文本颜色极性为亮文本,否则为暗文本。基于边缘的方法的一个主要问题是难以克服复杂背景的干扰,对于所处背景比较复杂的文本图像,由于背景中的非文本噪声也具有较强的边缘信息,这会给文本颜色极性的判别带来极大的干扰。\n发明内容\n[0004] 本发明解决的技术问题是提供一种能克服复杂背景的干扰,迅速有效判别图像中文本颜色极性的方法及装置。\n[0005] 根据本发明的一个方面,提供一种判别图像中文本颜色极性的方法包括:对原始图像T进行预处理,得到预处理后的文本图像TP;\n[0006] 从预处理后的文本图像TP中提取字符笔画特征,获得笔画图;\n[0007] 对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图;\n[0008] 根据笔画图和滤噪二值笔画图计算原始图像T的笔画强度,根据笔画强度判别原始图像T中文本颜色的极性。\n[0009] 进一步地说,所述笔画图包括:正向笔画图和负向笔画图,所述从预处理后的文本图像中提取字符笔画特征,获得笔画图,包括:从预处理后的文本图像TP中提取笔画特征,获得原始图像的正向笔画图;\n[0010] 将预处理后的图像TP进行反色,得到其反色图像TP,并从中提取笔画特征,获得原始图像的负向笔画图SN。\n[0011] 进一步地说,所述滤噪二值笔画图包括:滤噪正向二值笔画图和滤噪负向二值笔画图,所述对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图,包括:对笔画图进行二值化处理,获得包括正向二值笔画图和负向二值笔画图的二值笔画图;\n[0012] 根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。\n[0013] 进一步地说,所述根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图,包括:\n[0014] 第一步,确定迭代公式\n[0015] \n[0016] 所述迭代公式包括:迭代变量i、第i步滤噪二值笔画图的筛选结果 中点p的像素值 第i-1步滤噪二值笔画图的筛选结果 中点p的像素值 笔\n画图s及其中点p的像素值S(p)、μi和δi,其中:\n[0017] μi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图 中像素值为255的点所对应区域的均值,其计算公式为:\n[0018] \n[0019] δi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图 中像素值为255的点所对应区域的标准差,其计算公式为:\n[0020] \n[0021] 所述,N为第i-1步滤噪二值笔画图 中像素值为255的点的个数;\n[0022] 第二步,初始化迭代变量;\n[0023] 第三步,计算并判断所述均值和标准差是否满足|μi-μi-1|小于第一给定阈值T1,并且|δi-δi-1|小于第二给定阈值T2的迭代终止条件,若满足,则迭代完成;否则,更新迭代变量,循环迭代;\n[0024] 第四步,得到滤噪二值笔画图。\n[0025] 进一步地说,所述笔画强度包括:正向笔画强度和负向笔画强度,所述根据笔画图和滤噪二值笔画图计算原始图像T的笔画强度,根据笔画强度判别原始图像T中文本颜色的极性,包括:\n[0026] 通过公式 计算原始图像T的正向笔画强度,其中SP为原始图像T\n的正向笔画图, 为所述SP对应的滤噪正向二值笔画图;\n[0027] 通过公式 计算原始图像T的负向笔画强度,其中SN为原始图像\nT的负向笔画图, 为所述SN对应的滤噪负向二值笔画图;\n[0028] 如果正向笔画强度EP大于负向笔画强度EN,则判定原始文本图像T中字符为亮底暗字;否则,判定原始文本图像T中字符为暗底亮字。\n[0029] 进一步地说,所述对原始图像T进行预处理,得到预处理后的文本图像TP,包括:\n当原始图像T的原始宽度大于原始高度的二倍时,确定原始图像T中的文本为横向排列文本,将原始图像T的原始高度归一化为预定尺寸,将原始宽度按照原始高度和原始宽度的比值等比例缩放,得到预处理后的文本图像TP;\n[0030] 当原始图像T的原始宽度不大于原始高度的二倍时,确定原始图像T中的文本为纵向排列文本,将原始图像T的原始宽度归一化为预定尺寸,将原始高度按原始高度和原始宽度的比值等比例缩放,得到预处理后的文本图像TP。\n[0031] 根据本发明的另一个方面,提供一种判别图像中文本颜色极性的装置包括:预处理模块,用于对原始图像T进行预处理,得到预处理后的文本图像TP;\n[0032] 提取模块,用于从预处理后的文本图像TP中提取字符笔画特征,获得笔画图;\n[0033] 笔画图处理模块,用于对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图;\n[0034] 颜色极性判断模块,用于根据笔画图和滤噪二值笔画图计算原始图像T的笔画强度,根据笔画强度判别原始图像T中文本颜色的极性。\n[0035] 进一步地说,所述笔画图处理模块进一步包括二值化单元,用于对笔画图进行二值化处理,获得包括正向二值笔画图和负向二值笔画图的二值笔画图;\n[0036] 噪声过滤单元,用于根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。\n[0037] 进一步地说,所述噪声过滤单元进一步包括:\n[0038] 公式确定子单元,用于确定迭代公式\n[0039] \n[0040] 所述迭代公式包括:迭代变量i、第i步滤噪二值笔画图的筛选结果 中点p的像素值 第i-1步滤噪二值笔画图的筛选结果 中点p的像素值 笔\n画图S及其中点p的像素值S(p)、μi和δi,其中:\n[0041] μi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图 中像素值为255的点所对应区域的均值,其计算公式为:\n[0042] \n[0043] δi为第i步迭代过程中,所述笔画图S中与第i-1步滤噪二值笔画图 中像素值为255的点所对应区域的标准差,其计算公式为:\n[0044] \n[0045] 所述,N为第i-1步滤噪二值笔画图 中像素值为255的点的个数;\n[0046] 初始化子单元,用于初始化迭代变量;\n[0047] 迭代判断子单元,用于计算并判断所述均值和标准差是否满足|μi-μi-1|小于第一给定阈值T1,并且|δi-δi-1|小于第二给定阈值T2的迭代终止条件,若满足,则迭代完成;否则,更新迭代变量,循环迭代;\n[0048] 生成子单元,用于得到滤噪二值笔画图。\n[0049] 进一步地说,所述颜色极性判断模块进一步包括:\n[0050] 笔画强度计算单元,用于通过公式 计算原始图像T的正向笔画强\n度,其中SP为原始图像T的正向笔画图, 为所述SP对应的滤噪正向二值笔画图;通过公式计算原始图像T的负向笔画强度,其中SN为原始图像T的负向笔画图,\n为所述SN对应的滤噪负向二值笔画图;\n[0051] 颜色极性判断单元,用于当正向笔画强度Ep大于负向笔画强度EN,则判定原始文本图像T中字符为亮底暗字;否则,判定原始文本图像T中字符为暗底亮字。\n[0052] 本发明利用文本的笔画信息,可有效地消除复杂背景所带来的干扰,利用文本正向、负向笔画图中的笔画强度来度量图像中文本的颜色极性,可以有效地判断出图像的文本颜色的极性,且计算简单方便。\n附图说明\n[0053] 图1是本发明实施例提供的一种图像中文本颜色极性的判别方法的流程示意图;\n[0054] 图2是图1所示方法中对原始图像T的尺寸进行预处理,得到预处理后的文本图像TP的流程示意图;\n[0055] 图3是图1所示方法中对预处理后的文本图像TP进行笔画提取,得到正向笔画图SP和负向笔画图SN的流程示意图;\n[0056] 图4是图1所示方法中对笔画图进行二值化处理、噪声过滤处理后得到滤噪二值笔画图的流程示意图;\n[0057] 图5是本发明实施例提供的对预处理后的文本图像进行笔画提取后得到正向笔画图的示意图;\n[0058] 图6是本发明实施例提供的对预处理后的文本图像进行笔画提取后得到负向笔画图的示意图;\n[0059] 图7是本发明实施例提供的对图5所示正笔画图进行二值化处理后得到的正向二值笔画图的示意图;\n[0060] 图8是本发明实施例提供的对图6所示负笔画图进行二值化处理后得到的负向二值笔画图的示意图;\n[0061] 图9是本发明实施例提供的对图7所示的正向二值笔画图进行噪声过滤处理后得到的噪声滤出后的滤噪正向二值笔画图的示意图;\n[0062] 图10是本发明实施例提供的对图8所示的负向笔画二值图进行噪声过滤处理后得到的噪声滤出后的滤噪负向二值笔画图的示意图;\n[0063] 图11是本发明实施例提供的一种判别图像中文本颜色极性的装置的结构框图;\n[0064] 图12是图11所示装置中笔画图处理模块的结构框图;\n[0065] 图13是图12所示笔画图处理模块中噪声过滤单元的结构框图;\n[0066] 图14是图11所示装置中颜色极性判断模块的结构框图。\n具体实施方式\n[0067] 参见图1,本发明实施例提供了一种判别图像中文本颜色极性的方法包括:\n[0068] 步骤10、对原始图像T进行预处理,得到预处理后的文本图像TP。\n[0069] 本步骤所述的原始图像是指包含文本信息的灰度文本图像T,对原始图像进行预处理主要是对其尺寸进行归一化。进行归一化的目的是将输入的原始图像T归一化到一个标准的尺寸,得到文本图像TP,以便于处理和比较。\n[0070] 由于文本的排列方式可以为横向和纵向,需要对这两种情况分别予以处理,设原始图像T的原始高度为H,原始宽度为W。如图2所示,本发明实施例提供的对原始图像T的尺寸进行归一化,得到预处理后的文本图像Tp包括:\n[0071] 步骤101、当原始图像T的原始宽度W大于原始高度H的二倍时,即W>2H,确定原始图像T中的文本为横向排列文本,将原始图像T的原始高度H归一化为预定尺寸,将原始宽度W按照原始高度和原始宽度的比值(H/W)等比例缩放,得到预处理后的文本图像TP;\n[0072] 步骤102、当原始图像T的原始宽度W不大于原始高度H的二倍时,即W≤2H,确定原始图像T中的文本为纵向排列文本,将原始图像T的原始宽度W归一化为预定尺寸,将原始高度H按原始高度和原始宽度的比值(H/W)等比例缩放,得到预处理后的文本图像TP。\n[0073] 具体将原始图像T的原始高度或原始宽度归一化为多大尺寸取决于使用本发明的方法的系统采集的原始图像的分辨率,本例中预定尺寸为64个像素点。但本发明的方法预定的归一化尺寸不局限于此。\n[0074] 步骤20、从预处理后的文本图像TP中提取字符笔画特征,获得笔画图。\n[0075] 文字一般是由不同方向的笔画规则排列组成,文本的笔画一般包括如下特性:\n[0076] (1)为了方便阅读,字符笔画颜色与背景颜色通常存在较大的色差;\n[0077] (2)字符笔画可以视为小于某一宽度上限的双边结构;\n[0078] (3)字符的笔画以0,π/4,π/2,3π/4四个方向为主。\n[0079] 基于字符笔画的上述特性,可采用笔画提取算子(参见参考文献【3】)对文本图像TP进行笔画特征提取,具体计算公式如下:\n[0080] \n[0081] \n[0082] 其中,d=0,1,2,3,分别代表笔画的0,π/4,π/2,3π/4四个方向,W为笔画宽度上限;fd(p+i)表示文本图像TP在d方向上与点p距离为i的点的像素灰度值。\n[0083] 提取上述四个方向笔画特征的最大值,生成笔画特征图,即笔画图,可以采用以下计算公式表示:\n[0084] \n[0085] 其中,S(p)为笔画图中点p的笔画特征值。\n[0086] 本发明的方法需要获得原始图像的正向笔画图Sp和负向笔画图SN。根据上述公式(1)、(2)和(3),分别得到原始图像的正向笔画图Sp和负向笔画图SN,所述负向笔画图是将经过预处理后的文本图像经反色处理后,从中提取的笔画图。如图3所示,本发明实施例提供的从预处理后的文本图像TP中提取笔画特征,获得笔画图包括:\n[0087] 步骤201、从预处理后的文本图像TP中提取笔画特征,获得原始图像的正向笔画图SP,计算公式为:\n[0088] \n[0089] \n[0090] \n[0091] 其中,p表示文本图像TP上的点,Sp(p)为文本图像TP上的点p的笔画特征值,得到的正向笔画图SP如图5所示。\n~\n[0092] 步骤202、将预处理后的图像TP进行反色,得到其反色图像TP ,并从中提取笔画特征,获得原始图像的负向笔画图SN。\n~ ~\n[0093] 通过公式Tp (p)=255-Tp(p)可以得到经预处理后的图像TP的反色图像TP ,利~\n用公式(1)、(2)和(3),提取反色图像TP 的笔画特征,得到原始图像的负向笔画图SN。具体计算公式为:\n[0094] \n[0095] \n[0096] \n~ ~\n[0097] 其中,p表示文本图像TP 上的点,SN(p)为文本图像TP 上的点p的笔画特征值,得到的负向笔画图SN如图6所示。\n[0098] 步骤30、对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图。\n[0099] 上一步获得的笔画图包括:正向笔画图SP和负向笔画图SN。\n[0100] 如图4所示,本发明实施例提供的分别对所述正向笔画图SP和负向笔画图SN进行二值化和噪声过滤处理,得到滤噪正向二值笔画图 和滤噪负向二值笔画图 具体包括:\n[0101] 步骤301、对笔画图进行二值化处理,获得二值笔画图。\n[0102] 所谓二值化(Binarization)是指,一幅图像包括目标物体、背景还有噪声,要想从多值的数字图像中直接提取出目标物体,最常用的方法就是设定一个阈值t,用t将图像的数据分成两部分:大于t的像素群和小于t的像素群。这是研究灰度变换的最特殊的方法。在本发明中,本领域技术人员采用任一种二值化处理的方法都可行的,例如,采用大津法(参见参考文献【4】)求得最佳阈值,获得二值笔画图;或者,采用灰度直方图法或改进的灰度直方图等,本发明对此不需要进行限定。\n[0103] 本实施例中采用大津法分别对正向笔画图SP和负向笔画图SN进行二值化处理,分别得到正向二值笔画图BP和负向二值笔画图BN。获得二值笔画图具体公式如下:\n[0104] \n[0105] 其中,t为自适应选择的最优分割阈值,计算公式为:\n2\n[0106] t=max{i|ω1(i)×ω2(i)×(μ1(i)-μ2(i)),0≤i≤255}\n[0107] 式中ω1(i)为原始图像T中像素值小于i的点的个数,所述ω2(i)分别为原始图像T中像素值大于i的点的个数,所述μ1(i)为原始图像T中像素值小于i的点的均值,所述μ2(i)为原始图像T中像素值大于i的点的均值。\n[0108] 按照上述方法,可以分别获得正向二值笔画图Bp和负向二值笔画图BN。\n[0109] 步骤302、根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。\n[0110] 正向二值笔画图SP和负向二值笔画图SN中像素值为255的点对应的区域应为文本区域,但由于一些具有类似笔画特性的非文本噪声干扰,正向二值笔画图Sp和负向二值笔画图SN中还包含有一些噪声,因此还需要进行噪声过滤。噪声过滤的基本原理是利用文本图像中字符区域具有相似颜色的这一特性,通过不断的迭代筛选,滤除其中颜色差异较大的点(即噪声点),保留颜色差异较小的点。\n[0111] 对二值笔画图进行噪声过滤,得到滤噪二值笔画图,包括:\n[0112] 第一步,确定迭代公式。\n[0113] 令i为迭代变量, 为对二值笔画图B进行第i步噪声过滤的结果, 是第i步滤噪二值笔画图的筛选结果 中点p的像素值, 是第i-1步滤噪二值笔画图的筛选结果 中点p的像素值,S(p)是二值笔画图B中点p的像素值, 的计算公式为:\n[0114] \n[0115] 其中,μi为第i步迭代过程中,笔画图S中与第i-1步滤噪二值笔画图 中像素值为255的点所对应区域的均值;δi为第i步迭代过程中,笔画图S中与第i-1步滤噪二值笔画图 中像素值为255的点所对应区域的标准差,其计算公式分别为:\n[0116] \n[0117] \n[0118] 式中,S(p)和 分别为笔画图S和其对应的第i-1步滤噪二值笔画图 中点p的像素值,N为第i-1步滤噪二值笔画图 中像素值为255的点的个数。\n[0119] 第二步,初始化迭代变量。\n[0120] 迭代变量i初始化为1,设置初始比对模板 均值μ0=0,方差δ0=0。\n[0121] 第三步,计算并判断所述均值和标准差是否满足终止迭代条件,若满足,则迭代筛选完成;否则,更新迭代变量,循环迭代。\n[0122] 根据公式(4)、(5)和(6)计算μi、δi和Bi*。若为第一步迭代,则i=1。判断第i步迭代过程和上一步中笔画图S中与第i-1步滤噪二值笔画图 中像素值为255的点所对应区域的均值和标准差,若满足|μi-μi-1|小于第一给定阈值T1,并且满足|δi-δi-1|小于第二给定阈值T2的条件,说明当前点颜色差异很小,则循环迭代终止,转至第三步;否则,更新迭代变量i=i+1,循环执行第三步,利用公式(4)~(6)更新计算μi+1、δi+1和*\nBi+1,继续迭代。所述第一给定阈值T1的均值的迭代终止条件,所述第二给定阈值T2是标准差的迭代终止条件,本例中给定T1为0.001,T2为0.01,若噪声过滤的精确度要求不高,可以适当放宽第一给定阈值和第二给定阈值。\n[0123] 第四步,得到滤噪二值笔画图。\n[0124] 以上公式(4)~(6)对正向二值笔画图和负向二值笔画图通用,针对正向二值笔* *\n画图BP,式中的S为SP,Bi =Bp,进行噪声过滤后得到滤噪正向二值图 针对负向二值笔* *\n画图BN,式中的S为SN,Bi =BN,进行噪声过滤后得到滤噪负向二值笔画图[0125] 经过噪声过滤处理,可将图7所示的正向二值笔画图处理成如图9所示的滤噪正向二值笔画图,可将图8所示的负向二值笔画图处理成如图10所示的滤噪负向二值笔画图。\n[0126] 步骤40、根据笔画图和滤噪二值笔画图计算原始图像的笔画强度,根据笔画强度判别原始图像中文本颜色的极性。\n[0127] 上一步骤获得的滤噪二值笔画图包括滤噪正向二值笔画图 和滤噪负向二值笔画图 滤噪正向二值笔画图 的笔画强度即为原始图像T的正向笔画强度,滤噪负向二值笔画图 的笔画强度即为原始图像T的负向笔画强度。\n[0128] 根据原始图像T的正向笔画图SP及所述SP对应的滤噪正向二值笔画图 通过下述公式(7)计算原始图像T的正向笔画强度,得到:\n[0129] \n[0130] 根据原始图像T的负向笔画图SN及所述SN对应的滤噪负向二值笔画图 通过下述公式(8)计算原始图像T的负向笔画强度,得到:\n[0131] \n[0132] 根据笔画强度判别原始图像中文本颜色的极性,包括:如果正向笔画强度Ep大于负向笔画强度EN,则判定原始图像T中字符为亮底暗字;否则,判定原始文本图像T中字符为暗底亮字。\n[0133] 本发明提供的方法利用文本的笔画信息,可有效地消除复杂背景所带来的干扰,利用文本正向、负向笔画图中的笔画强度来度量图像中文本的颜色极性,可以有效地判断出图像的文本颜色的极性,且计算简单方便。\n[0134] 如图11所示,本发明实施例还提供一种判别图像中文本颜色极性的装置,包括预处理模块1、提取模块2、笔画图处理模块3及颜色极性判断模块4。其中:\n[0135] 预处理模块1用于对原始图像T进行预处理,得到预处理后的文本图像TP,具体如何进行预处理,参见图2及其说明,不再赘述;\n[0136] 提取模块2用于从预处理后的文本图像TP中提取字符笔画特征,获得笔画图,具体如何获得笔画图,参见图3及其说明;\n[0137] 笔画图处理模块3用于对获得的笔画图进行二值化和噪声过滤处理,得到滤噪二值笔画图;\n[0138] 颜色极性判断模块4用于根据笔画图和滤噪二值笔画图计算原始图像T的笔画强度,根据笔画强度判别原始图像T中文本颜色的极性。\n[0139] 如图12所示,笔画图处理模块3进一步包括:二值化单元31和噪声过滤单元32。\n二值化单元31用于对笔画图进行二值化处理,获得包括正向二值笔画图和负向二值笔画图的二值笔画图。具体如何获得包括正向二值笔画图和负向二值笔画图的二值笔画图参见步骤301。噪声过滤单元32用于根据笔画图,通过不断迭代筛选的方法对二值笔画图进行噪声过滤,得到滤噪二值笔画图。如图13所示,噪声过滤单元32进一步包括公式确定子单元321、初始化子单元322、迭代判断子单元323及生成子单元324。其中,\n[0140] 公式确定子单元321,用于确定迭代公式\n[0141] \n[0142] 所述迭代公式包括:迭代变量i、第i步滤噪二值笔画图的结果 笔画图S中点p的像素值S(p)和所述笔画图S对应的第i-1步滤噪二值笔画图 中点p的像素值μi和δi,其中:\n[0143] μi为第i步迭代过程中,所述笔画图S中与滤噪二值笔画图 中像素值为255的点所对应区域的均值,其计算公式为:\n[0144] \n[0145] δi为第i步迭代过程中,所述笔画图S中与滤噪二值笔画图 中像素值为255的点所对应区域的标准差,其计算公式为:\n[0146] \n[0147] 所述,N为第i-1步滤噪二值笔画图 中像素值为255的点的个数;\n[0148] 初始化子单元322,用于初始化迭代变量;\n[0149] 迭代判断子单元323,用于计算并判断所述均值和标准差是否满足|μi-μi-1|小于第一给定阈值T1,并且|δi-δi-1|小于第二给定阈值T2的迭代终止条件,若满足,则迭代完成;否则,更新迭代变量,循环迭代;\n[0150] 生成子单元324,用于得到滤噪二值笔画图。\n[0151] 如图14所示,颜色极性判断模块4进一步包括笔画强度计算单元41和颜色极性判断单元42。其中,笔画强度计算单元41用于通过公式 计算原始图像T\n的正向笔画强度,其中SP为原始图像T的正向笔画图, 为所述SP对应的滤噪正向二值笔画图;通过公式 计算原始图像T的负向笔画强度,其中SN为原始图像T的\n负向笔画图, 为所述SN对应的滤噪负向二值笔画图。颜色极性判断单元42用于当正向笔画强度Ep大于负向笔画强度EN时,判定原始图像T中字符为亮底暗字;否则,判定原始图像T中字符为暗底亮字。\n[0152] 本发明提供的装置利用文本的笔画信息,可有效地消除复杂背景所带来的干扰,利用文本正向、负向笔画图中的笔画强度来度量图像中文本的颜色极性,可以有效地判断出图像的文本颜色的极性,且计算简单方便。\n[0153] 上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。\n[0154] 参考文献列表\n[0155] 【1】Jiqiang Song,Min Cai,Micheal R.Lyu.A Robust Statistic Method for Classifying Color Polarity of Video Text.ICME,vol.2,pp.385-388,2003[0156] 【2】Jie Xi,Xiansheng Hua,Xiangrong Chen,Wenyin Liu,Hongjiang Zhang.A Video Text Detection and Recognition System.ICME,vol.1,pp.873-876,2001[0157] 【3】X.Ye,M.Cheriet,C Y.Suen.Stroke-model-based character extraction from gray-level document images.IEEE Transaction Image Processing,vol.10,pp.1152-1161,2001\n[0158] 【4】OTSU N.A threshold selection method from gray-level histograms[M].IEEE Transactions on Systems,Man and Cybernetics,vol.9,NO.1,pp.62-66,1979
法律信息
- 2018-12-28
专利权的转移
登记生效日: 2018.12.07
专利权人由汉王科技股份有限公司变更为北京汉王智远科技有限公司
地址由100193 北京市海淀区东北旺西路8号5号楼三层变更为100193 北京市海淀区东北旺西路8号5号楼3层356室
- 2013-01-09
- 2011-08-24
实质审查的生效
IPC(主分类): G06K 9/20
专利申请号: 201110080923.9
申请日: 2011.03.31
- 2011-07-13
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |