著录项信息
专利名称 | 手机中使用图像识别进行名片信息的采集与录入的方法 |
申请号 | CN200510026492.2 | 申请日期 | 2005-06-06 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2006-12-13 | 公开/公告号 | CN1877598 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/00 | IPC分类号 | G;0;6;K;9;/;0;0查看分类表>
|
申请人 | 英华达(上海)电子有限公司 | 申请人地址 | 上海市桂箐路7号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 英华达(上海)电子有限公司 | 当前权利人 | 英华达(上海)电子有限公司 |
发明人 | 郑勇平;何代水 |
代理机构 | 上海智信专利代理有限公司 | 代理人 | 王洁 |
摘要
本发明涉及一种手机中使用图像识别进行名片信息的采集与录入的方法,其中,所述的方法包括手机通过拍摄镜头获取名片的图像信息、手机对图像进行预处理、手机对预处理后的图像进行版面分析和区域分割、手机对分割后各个区域进行文字识别、手机对文字识别的内容进行数据识别和信息分析、将数据存入手机的电话簿中。采用该种手机中使用图像识别进行名片信息的采集与录入的方法,具有广泛的应用基础和应用前景;同时信息的采集由照相手机独立完成,无需任何附加的其它硬设备;而且解决了用户手动录入名片信息到电话本中速度慢的缺点;自动和手动模式的采集选择方案,进一步提高了信息采集的准确率和可选的信息采集录入速度,达到了更好的应用效果。
1、一种手机中使用图像识别进行名片信息的采集与录入的方法,其特征在于,所述的方法包括以下步骤: (1)手机通过拍摄镜头获取名片的图像信息; (2)手机对图像进行预处理; (3)手机对预处理后的图像进行版面分析和区域分割: (a)预先在手机中设置名片的版面模板; (b)将图像使用决策树进行模板匹配; (c)根据模板匹配的结果进行图像版面的区域分割处理; (4)手机对分割后各个区域进行文字识别; (5)手机对文字识别的内容进行数据识别和信息分析; (6)将数据存入手机的电话簿中。
2、 根据权利要求1所述的手机中使用图像识别进行名片信息的采集与录入的方法,其特 征在于,所述的获取名片的图像信息包括以下步骤:(1)将手机的拍摄镜头设置成高象素分辨率拍摄模式; (2 )将整张名片数据的完整拍摄录入。
3、 根据权利要求1或2所述的手机中使用图像识别进行名片信息的采集与录入的方法, 其特征在于,所述的图像的预处理包括以下步骤:(1)将图像进行二值化处理或灰度级别处理;(2 )以图像的边沿或文字的行向为基准进行倾斜度^^正。
4、 根据权利要求l所述的手机中使用图像识别进行名片信息的采集与录入的方法,其特 征在于,所述的名片的版面模板包括:(1) Tl ——单位、姓名及职称、地址三块依次由上至下排列,有两个地址块;(2) T2 —一单位、姓名及职称、地址三块依次由上至下排列,有一个地址块;(3) T3 —一姓名及职称放到最上部,有一个地址块;(4) T4 一一姓名及职称放到最上部,有两个地址块;(5) T5 —一单位块在最上部,姓名及职称块与地址并列;(6) T6 —一姓名及职称在最上部,单位、地址并列在下部;(7) T7 — —除去以上排版方式之外的其他方式。
5、 根据权利要求4所述的手机中使用图像识别进行名片信息的采集与录入的方法,其特 征在于,所述的使用决策树进行模板匹配包括以下步骤:(1) 手机根据用户操作预先设定空白间隔阈值;(2) 对图像自上而下垂直方向进行投影;(3 )判断图像中的空白间隔是否大于所述的空白间隔阈值;(4)如果不是,则匹配模板为T7,并进行手动交互方式确定版面区域分割处理;(5 )反之,则找到第一块;(6) 判断垂直方向是否可以继续投影;(7) 如果否,则判断水平方向是否可以继续投影,如果水平方向不可以继续投影,则匹 配模板为T7,并进行手动交互方式确定版面区域分割处理;如杲水平方向可以继续投影,则 匹配模板属于T5或者T6,并进一步采用水平和垂直投影完成模板匹配;(8) 如果是,则判断水平方向是否可以继续投影,如果水平方向不可以继续投影,则匹 配才莫板属于T2或者T3,并进一步采用水平和垂直投影完成模板匹配;如果水平方向可以继 续投影,则匹配模板属于Tl或者T4,并进一步采用水平和垂直投影完成模板匹配。
6、 根据权利要求5所述的手机中使用图像识别进行名片信息的采集与录入的方法,其特 征在于,所述的手动交互方式确定版面区域分割处理包括以下步骤:(1) 选择当前需要识别的字段名称;(2) 选择该字段的识别框的大小;(3) 选择后进入手机操作接口 ,并根据用户对方向键的操作来移动识别区域,进行识别 区域的设定;(4 )重复步骤(1)至(3 ),直到将所需的识别内容全部确定。
7 、根据权利要求1或2所述的手机中使用图像识别进行名片信息的采集与录入的方法, 其特征在于,所述的文字识别包括以下步骤:(1) 文本行字切分:将大幅的图像先切割为行,再从图像行中分离出单个字符;(2) 文字特征提取:从单个字符图像上提取统计特征或结构特征,包括细化和归一化;(3) 文字识别处理:从学习得到的特征库中找到与待识字符相似度最高的字符类。
8、根据权利要求4所述的手机中使用图像识别进行名片信息的采集与录入的方法,其特 征在于,所述的对文字识别的内容进行数据识别和信息分析包括以下步骤:(l)将姓名块、单位块、职称块的识别结果与手^L电话簿中的姓名、单位名称和其它信 息字段直接对应; (2) 将地址块中的文本内容进行字段抽^l处理。
9、根据权利要求8所述的手机中使用图像识别进行名片信息的采集与录入的方法,其特 征在于,所述的地址块中的文本内容的结构为:〈地址块〉:••=〈字段1〉 i 〈字段2〉 I 〈字段3> ...〈字段i〉::=〈先导词〉I 〈分界符〉i 〈内容〉〈内容〉::=〈字符1〉 I 〈字符2〉 I 〈字符3〉... 分界符集合={':','.',' '}先导词、内容由字段种类决定,例如对电话字段有: 先导词集合={'电话','TEL' ,' PHONE'.,. } 内容字符集={数位,'(',"','-V ','.'}, 所述的字IS:抽取处理包括以下步骤:(1)先导词容错匹配;(2 )跳过分界符;(3) 根据内容字符集判断内容是否合法;(4 )如果内容合法,则针对名片的专用词库和规则库为&出,自动校对识别结果并修改 明显的错误;(5)反之,则回到步骤(1)。
手机中使用图像识别进行名片信息的采集与录入的方法\n技术领域\n本发明涉及手机领域,特别涉及手机图像信息识别处理领域,具体是指一种手机中使用 图^^识别进行名片信息的采集与录入的方法。\n背景技术\n众所周知,印刷制作的名片是商业时代的产物,是人们个人信息交流的一种载体,受到 了社会的广泛使用。但为了方便快捷的从数以百计的印刷制作的名片中找到所需的信息,却 不是件容易的事,需要颇费一番功夫。将名片电子化可以^艮好的解决这个问题,可以快速的 完成检索、归类等工作,方便用户的使用。为此目前市场上出现了众多的名片机或名片电子 化软件,名片机是一种将印刷制作的名片电子化的专门设备,而名片电子化软件是利用图像 识别技术对图像化后的名片进行信息分析和采集录入到计算机数据库中的一套软件解决方 法。但这两种方案的实际使用率并不高,主要存在以下不足:\n(1 )使用不便捷,因为名片信息的采集和保存需要另外再配备一个专门硬设备或需要使用计 算机来完成这个工作显得非常不方便,所以它们的实用价值未能被消费者广泛采纳;\n(2)因名片的印刷风格各异,名片机的信息自动采集效果欠佳,而通过计算机软件来完成这 一工作则还需要配备专门的扫描仪,并且对后续获得的名片信息的转存、使用还需要存储到 PDA或移动电话等设备中才能方便用户外出的使用,存在存储格式(字段)匹配的问题。\n如何能够方便快捷的完成对名片的电子化过程,并可以达到随时方便的检索、应用名片 电子化后的信息,是目前需要解决的问题。\n发明内容\n本发明的目的是克服了上述现有技术中的缺点,提供一种使用方便快捷、信息采集录入 准确度较高、性能稳定、适用性较强的手机中使用图像识别进行名片信息的采集与录入的方 法。\n为了实现上述的目的,本发明的手机中使用图像识别进行名片信息的采集与录入的方法 如下:\n该手机中使用图像识别进行名片信息的采集与录入的方法,其主要特点是,所述的方法 包括以下步骤:\n(1) 手机通过拍摄镜头获取名片的图像信息;\n(2) 手机对图像进行预处理;\n(3) 手机对预处理后的图像进行版面分析和区域分割;\n(4) 手机对分割后各个区域进行文字识别;\n(5 )手机对文字识别的内容进行数据识别和信息分析; (6 )将数据存入手机的电话簿中。\n该手机中使用图像识别进行名片信息的采集与录入的方法的获取名片的图像信息包括以 下步骤:\n(1) 将手机的拍摄镜头设置成高象素分辨率拍摄模式;\n(2) 将整张名片数据的完整拍摄录入。\n该手机中使用图像识别进行名片信息的釆集与录入的方法的图像的预处理包括以下步\n骤:\n(1)将图像进行二值化处理或灰度级别处理;\n(2 )以图像的边沿或文字的行向为基准进行倾斜度^ft正。\n该手机中使用图像识别进行名片信息的采集与录入的方法的版面分析和区域分割包括以 下步骤:\n(1) 预先在手机中设置名片的版面模板;\n(2) 将图像使用决策树进行模板匹配;\n(3) 根据模板匹配的结果进行图像版面的区域分割处理。\n该手机中使用图像识别进行名片信息的采集与录入的方法的名片的版面模板包括:\n(1) Tl 一一单位、姓名及职称、地址三块依次由上至下排列,有两个地址块;\n(2) T2 —一单位、姓名及职称、地址三块依次由上至下排列,有一个地址块;\n(3) T3 —一姓名及职称放到最上部,有一个地址块;\n(4) T4 一一姓名及职称放到最上部,有两个地址块;\n(5) T5 — —单位块在最上部,姓名及职称块与地址并列;\n(6) T6 —一姓名及职称在最上部,单位、地址并列在下部;\n(7) T7 —一除去以上排版方式之外的其他方式。\n该手机中使用图像识别进行名片信息的采集与录入的方法的使用决策树进行模板匹配包\n-括以下步骤:\n(1) 手机根据用户操作预先设定空白间隔阈值;\n(2) 对图像自上而下垂直方向进4亍投影;\n(3) 判断图像中的空白间隔是否大于所述的空白间隔阈值;\n(4) 如果不是,则匹配模板为T7,并进行手动交互方式确定版面区域分割处理;\n(5) 反之,则找到第一块;\n(6) 判断垂直方向是否可以继续投影;\n(7) 如果否,则判断水平方向是否可以继续投影,如果水平方向不可以继续投影,则匹 配模板为T7,并进行手动交互方式确定版面区域分割处理;如果水平方向可以继续投影,则 匹配模板属于T5或者T6 ,并进一步采用水平和垂直投影完成模板匹配;\n(8) 如果是,则判断水平方向是否可以继续投影,如果水平方向不可以继续投影,则匹 配模板属于T2或者T3,并进一步采用水平和垂直投影完成模板匹配;如果水平方向可以继 续投影,则匹配模板属于Tl或者T4,并进一步采用水平和垂直投影完成模板匹配。\n该手机中^f吏用图像识别进行名片信息的采集与录入的方法的手动交互方式确定版面区域 分割处理包括以下步骤:\n(1)选择当前需要识别的字段名称; (2 )选择该字段的识别框的大小;\n(3 )选择后进入手机操作接口 ,并根据用户对方向键的操作来移动识别区域,进行识别 区域的设定;\n(4 )重复步骤(1)至(3 ),直到将所需的识别内容全部确定。 该手机中使用图像识别进行名片信息的采集与录入的方法的文字识别包括以下步骤:\n(1) 文本行字切分:将大幅的图像先切割为行,再从图像行中分离出单个字符;\n(2) 文字特征提取:从单个字符图像上提取统计特征或结构特征,包括细化和归一化;\n(3) 文字识别处理:从学习得到的特征库中找到与待识字符相似度最高的字符类。 该手机中使用图像识别进行名片信息的采集与录入的方法的对文字识别的内容进行数据\n识别和信息分析包括以下步骤:\n(l)将姓名块、单位块、职称块的识别结果与手机电话簿中的姓名、单位名称和其它信 息字段直接对应;\n(2 )将地址块中的文本内容进行字段抽取处理。\n该手机中使用图像识别进行名片信息的采集与录入的方法的地址块中的文本内容的结构\n为:\n〈地址块〉::=〈字段1〉 I 〈字段2〉 I 〈字段3〉... 〈字段i〉::=〈先导词〉I 〈分界符〉I 〈内容〉 〈内容> 〈字符1〉 I 〈字符2〉 I 〈字符3> ... 分界符集合={':','.',' '}\n先导词、内容由字段种类决定,例如对电话字ISL有: 先导词集合={'电话','TEL',' PHONE'... }\n内容字符集-(数位,'(',')','-v V.'), 所述的字段抽取处理包括以下步骤: (1)先导词容错匹配; (2 )跳过分界符;\n(3 )根据内容字符集判断内容是否合法;\n(4 )如果内容合法,则针对名片的专用词库和规则库为&出,自动校对识别结果并修改 明显的错误;\n(5)反之,则回到步骤(1)。\n采用了该发明的手机中使用图像识别进行名片信息的采集与录入的方法,由于本发明阐 述的对名片信息的采集和录入方法是结合照相手机和图像识别技术完成的,同时随着科技发 展曰新月异,照相手机随着象素功能的不断提升,目前已经出现了几百万象素的照相手机, 其拍摄的照片效果几乎可以和专业相机拍摄的照片媲美,同时利用照相手机拍摄的图片分辨 率也已经达到了图像识别处理的要求,结合这两点完成名片信息的采集和录入已经成为可能, 并具有以下优点:\n(1) 因为移动电话已经达到了极大的普及,该项技术首先具有广泛的应用&出和应用前\n景;\n(2) 信息的采集由照相手机独立完成,无需任何附加的其它硬设备;\n(3) 将采集的信息保存在移动电话的电话本中,用户可以方便快捷的在任何需要的时候 使用,解决了用户手动录入名片信息到电话本中速度慢的缺点;\n(4) 自动和手动模式的采集选择方案,进一步提高了信息采集的准确率和可选的信息采 集录入速度,达到了更好的应用效果。\n附图说明\n图1为本发明的手机中使用图像识别进行名片信息的采集与录入的方法的流程图,\n图2为本发明的对名片图像使用决策树进行模板匹配的流程图。\n图3为本发明的对名片图像区域分割结果示意图。\n图4为本发明的对地址块进行字段抽取处理的流程图,\n图5 ( a ) ( b ) ( c ) ( d ) ( e ) ( f )为本发明的手动交互式信息采集识别过程示意图。 具体实施方式\n为了能够更清楚地理解本发明的技术内容,特举以下实施例详细说明。 本发明首先将照相手机设置成高象素分辨率的拍照模式,将需要电子化的名片一一拍摄 录入到手机中。对名片图像利用名片版面的位置信息和名片知识分析名片版面的属性,将名 片信息进行分割,分割方法可以选择采用自动分割或由用户交互给出,之后对分割的各个区 域进行字符识别,并对识别结果做基于名片和词语的后处理,最后从识别结果中提取有用信 息存储到手机电话本的各个域段中,完成名片信息的采集和电话本信息的自动录入过程, 请参阅图l所示,该手机中使用图像识別进行名片信息的采集与录入的方法包括以下步\n骤:\n(1)手机通过拍摄镜头获取名片的图像信息,包括以下步骤:\n(a) 将手机的拍摄镜头设置成高象素分辨率拍摄模式;\n(b) 将整张名片数据的完整拍摄录入。\n(2 )手机对图像进行预处理,包括以下步骤:\n(a) 将图像进行二值化处理或灰度级别处理;\n(b) 以图像的边沿或文字的行向为基准进行倾斜度校正。\n在实际应用当中,为获得较好的系统处理图像,提高后续的分析和识别效果,在用照相 手机拍摄名片时需要注意几点, 一是将照相手机设置成较高象素分辨率拍摄模式,二是保证 整张名片数据的完整拍摄录入,以方便系统后续对名片版面的自动分析。得到名片图像后进 行必要的图像预处理,主要分成两个步骤完成, 一个是将图像进行二值化处理(或灰度级别 处理)以减少背景噪音的干扰,还可以在此过程中运用其它減少图像噪音的方法,目的是突 出需要处理的有用数据信息。之后对图像进行倾斜度校正,以名片的边沿或文字的行向为基 准进行校正,以使后续的版面分析和识别效率更理想。完成图像预处理后就可以开始真正的 名片信息分析和处理的核心过禾呈了 。\n(3 )手机对预处理后的图像进行版面分析和区域分割,包括以下步骤:\n(a )预先在手机中设置名片的版面模板,包括:\n(i) Tl — 一单位、姓名及职称、地址三块依次由上至下排列,有两个地址块;\n(ii) T2 ——单位、姓名及职称、地址三块依次由上至下排列,有一个地址块;\n(iii) T3——姓名及职称放到最上部,有一个地址块;\n(iv) T4——姓名及职称放到最上部,有两个地址块;\n(v) T5 —一单位块在最上部,姓名及职称块与地址并列;\n(vi) T6 — —姓名及职称在最上部,单位、地址并列在下部;\n(vii) T7 ——除去以上排版方式之外的其他方式。\n(b)将图像使用决策树进行模板匹配,请参阅图2所示,包括以下步骤: (i )手机根据用户操作预先设定空白间隔阈值;\n(ii) 对图像自上而下垂直方向进行投影;\n(iii) 判断图像中的空白间隔是否大于所述的空白间隔阔值;\n(iv) 如果不是,则匹配模板为T7,并进行手动交互方式确定版面区域分割处 理;\n(v) 反之,则找到第一块;\n(vi) 判断垂直方向是否可以继续投影;\n(vii) 如果否,则判断水平方向是否可以继续投影,如果水平方向不可以继续 投影,则匹配模板为T7,并进行手动交互方式确定版面区域分割处理;如果水 平方向可以继续投影,则匹配模板属于T5或者T6,并进一步采用水平和垂直投 影完成模板匹配;\n(viii) 如果是,则判断水平方向是否可以继续投影,如果水平方向不可以继续 投影,则匹配模板属于T2或者T3,并进一步采用水平和垂直投影完成^莫板匹配; 如果水平方向可以继续投影,则匹配模板属于Tl或者T4,并进一步采用水平和 垂直投影完成模板匹配。\n其中,手动交互方式确定版面区域分割处理包括以下步骤:\n(1) 选择当前需要识别的字段名称;\n(2) 选择该字段的识别框的大小;\n(3 )选择后进入手机操作接口 ,并根据用户对方向键的操作来移动识别区域,进行识别 区域的设定;\n(4 )重复步骤(1)至(3 ),直到将所需的识别内容全部确定。\n在实际应用当中,图像的版面分析可以采用自动和手动两种方式进行,版面自动分析是 利用名片版面的位置信息和名片知识分析名片版面的属性,将名片版面进行分割处理。另一 方面,为了提高分析和识别的时效性,剔除用户不需要的信息,也可以由用户交互完成这一 工作。因名片在不大的面积上集中了众多的信息,各种信息往往会在一定位置上分布,从而 使版面可以被大致分为单位块、姓名块、职称块、地址块等,而且块的大致位置也有规律性, 如:姓名往往与职称放在一起,地址块多在名片的下部,单位块大多在上部或中部。名片上 除含有上述基本信息外,为了美观还常有其它装饰性要素,主要有两种:图示和水平分隔线。 其中图标多为单位的标志,水平分隔线起内容分割作用。名片版面的一个重要特点是:各块 的相对位置较为稳定。根据收集到的近200张各式名片得到如下表的分类结果。\n表l名片版面分类\n
table see original document page 11\n有了以上的模板分类后,我们可以采用模板匹配的方法解决版面分析的问题。把上面的\n七类版面作为模板(Tl, T2, T3, T4, T5, T6, T7),对输入的名片进行匹配,看它属于哪一 种。 一种最直接的想法是顺序匹配,但这样做在最坏情况下要匹配七次,匹配的时效性无法 接受(因为底层操作是象素的投影,比较费时)。考虑各模板间有相似性,可以用决策树实现\n模板匹配。在确定模板类型后再用一些细微特征可消除水平分隔线和图示的影响,并把姓名 和职称分开。当系统中空白信息没有达到门限时可能会造成^"i吴发生,所以当有错误发生时,\n空白间隔d。由用户可以交互的给出。从表2版面分析效果可以知道,整版正确率可以达到91%,\n考虑到名片格式的多样性,这种自动版面分析效杲还是比较理想的,同时时效性也可以达到\n移动电话中处理的要求。请参阅图3所示,其是应用该算法的一个处理例子示意图。\n表2 版面分析效果\ntable see original document page 12\n\n(c )根据模板匹配的结果进行图像版面的区域分割处理。\n(4 )手机对分割后各个区域进行文字识别,包括以下步骤:\n(a) 文本行字切分:将大幅的图像先切割为行,再从图像行中分离出单个字符;\n(b) 文字特征提取:从单个字符图像上提取统计特征或结构特征,包括细化和归一 化;\n(c) 文字识别处理:从学习得到的特征库中找到与待识字符相似度最高的字符类。 (5 )手机对文字识别的内容进行数据识别和信息分析,包括以下步骤:\n(a)将姓名块、单位块、职称块的识别结果与手;f几电话簿中的姓名、单位名称和其 它信息字段直接对应; (b)将地址块中的文本内容进行字段抽取处理,请参阅图4所示,包括以下步骤:\n(i) 先导词容错匹配;\n(ii) 跳过分界符;\n(iii) 根据内容字符集判断内容是否合法;\n(iv )如果内容合法,则针对名片的专用词库和规则库为基础,自动校对识别结果 并修改明显的错误; (v)反之,则回到步骤(i )。 在实际使用当中,在进行文字的识别过程中,大致包括三个内容:文本行字切分,文字 特征提取和文字识別处理。行字切分是将大幅的图像先切割为行,再从图像行中分离出单个 字符的过程。特征提取是整个环节中最重要的一环,它是从单个字符图像上提取统计特征或 结构特征的过程,包括为此而做的细化(Thinning)、归一化(Normalization)(将大小不同\n的字体规一)等步骤。提取的特征的稳定性及有效性,直接决定了识別的性能。文字识別即 从学习得到的特征库中找到与待识字符相似度最高的字符类的过程。通过文字识别后就得到 了各个分割区域的文字内容,接下来为了实现相应内容自动填充到电话本中相应的字段中, 需要考虑相关内容的匹配问题。姓名块、单位块、职称块的识别结杲可与电话本中的姓名、 单位名称和其它信息等字段直接对应,但地址块就复杂多了,有住址、电话、电传、传真、 电子邮件、邮政编码等多项内容,这些内容无法用版面分析分开(这就是前面把它们放在一 起作版面分析的原因),只能靠对识别结果上下文的理解。 一般的语言的理解是比较困难的, 但名片信息有着明显的特殊性。最明显的一点是各字段多以明显的先导词开头,如:电话号 码前常见"电话"、"TEL"、 "PHONE"等字样。但实验表明只利用先导词匹配结果并不很理想, 原因是:(1)尽管字符识别程序的单字识别率很高,但对多个字符组成的先导词则不一定能 认对;(2)光靠先导词容易错分,例如:会因先导词"TEL"的存在把"TELEVISION STATION" 看成电话号码。改进的方法是进行细致的句法分析,地址块的文本有下面的结构:\n〈地址块〉::=〈字段1〉 I 〈字段2〉 I 〈字段3〉...\n〈字段i〉::=〈先导词〉I <分界符〉I 〈内容〉\n〈内容〉::=〈字符1〉 I 〈字符2〉 i 〈字符3〉... 分界符集合={':','.',' '}\n先导词、内容由字段种类决定,例如对电话字段有: 先导词集合={'电话','TEL' ,' PHONE'... } 内容字符集={数位,'(V)','-',' ','•"\n注意,这里采用了先导词的容4酱匹配,即:只要有先导词的部分字就认为找到了先导词。之\n所以能这样做是因为后面还要判决内容的合法性,不必担心先导词找错了。这种基于句法分\n析的字段抽取算法有很强的鲁棒性,在字符识别效果一般的情况下都能正确提取出各字段。\n对识别后的信息进行分析的另 一个作用是以针对名片的专用词库和规则库为^s出,自动校对\n识别结果,修改明显的错误。下面给出一个后处理的例子,其中加下划线的字识别程序认错\n了,但通过后处理均被纠正了。\n处理前:地址:中国北京复兴门外罗道庄\n^^舌:81. 0631 (总机)\n81, 2105 (直拨)\n电挂:8681\n邮政缝码:1000^6 处理后:地址字段[中国北京复兴门外罗道庄] 电话字段[8L 0631 (总机)81. 2105(直拨)] 电桂字段[8681] 邮政编码字段[100086 ]\n(6 )将数据存入手机的电话簿中。\n再请参阅图5所示,对于确认为T7模板类型的名片,因为其存在较复杂的排版格式,无 法按照正常的自动识别过程,系统同时提供了用户交互识别完成这类信息的识别录入功能。 具体情况如下:\n打开电话本后选择功能按钮后进入(a ),选择(b )名片识别采集进入(c )操作接口 , 此时可以选择自动识别采集和手动识别采集,在选择自动识别采集会提示是否采用默认d。值 进行版面分割,用户可以采用默认值或当自动识别有误时再选择修改d。值进行自动识别。同 时当按照自动识别流程判定该名片模板属于T7时也会提示自动进入该页面进行手动识别操 作。选择手动识别进入(d )选择手动交互识别选项设置,比如当前选择将识别字段填充为电 话本的姓名字段内,并选择识别框的大小,以便最快速的进行识别操作。选定后进入(e)操 作接口 ,可以通过方向键移动识别区域完成识别区域的设定,(d )和(e )可以反复进行以便 将所需的识别内容全部选定。当至少已经有一个识别区域^t选定后,返回到(e )接口时系统 菜单中会自动增加开始识别采集信息的功能选项,选择开始识别操作后,系统将自动将相应 的字段信息填充到电话簿的相应内容中如(f ),若需要修正或更改可在此处完成。\n在此说明书中,本发明已参照其特定的实施例作了描述。但是,很显然仍可以作出各种 修改和变换而不背离本发明的精神和范围。因此,说明书和附图应被认为是说明性的而非限 制性的。法律信息
- 2020-10-30
专利权的转移
登记生效日: 2020.10.20
专利权人由英华达(上海)电子有限公司变更为北京小米移动软件有限公司
地址由200233 上海市桂箐路7号变更为100085 北京市海淀区西二旗中路33号院6号楼8层018号
- 2008-01-16
- 2007-02-14
- 2006-12-13
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2005-01-05
|
2004-02-18
| | |
2
| |
2005-06-22
|
2003-12-17
| | |
3
| |
2005-03-09
|
2003-08-27
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2013-07-16 | 2013-07-16 | | |
已经帮助解决过
0个专利相关的问题
请问有什么能帮到你的吗?残忍拒绝