手机中使用图像识别进行名片信息的采集与录入的方法

发明专利有效专利

申请号：
CN200510026492.2
IPC分类号：G06K9/00
申请日期：
2005-06-06
申请人：
英华达（上海）电子有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	手机中使用图像识别进行名片信息的采集与录入的方法
申请号	CN200510026492.2	申请日期	2005-06-06
法律状态	授权	申报国家	中国
公开/公告日	2006-12-13	公开/公告号	CN1877598
优先权	暂无	优先权号	暂无
主分类号	G06K9/00 ? IPC结构图谱： G 物理 G0 仪器 G06 计算；推算；计数 G06K 数据识别；数据表示；记录载体；记录载体的处理（印刷本身入B41J） G06K9/00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置（用于图表阅读或者将诸如力或现状态的机械参量的图形转换为电信号的方法或装置入G06K 11/00；语音识别入G10L 15/00）〔1，7〕	IPC分类号	G;0;6;K;9;/;0;0查看分类表>
申请人	英华达（上海）电子有限公司	申请人地址	上海市桂箐路7号变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	英华达（上海）电子有限公司	当前权利人	英华达（上海）电子有限公司
发明人	郑勇平;何代水
代理机构	上海智信专利代理有限公司	代理人	王洁

摘要

本发明涉及一种手机中使用图像识别进行名片信息的采集与录入的方法，其中，所述的方法包括手机通过拍摄镜头获取名片的图像信息、手机对图像进行预处理、手机对预处理后的图像进行版面分析和区域分割、手机对分割后各个区域进行文字识别、手机对文字识别的内容进行数据识别和信息分析、将数据存入手机的电话簿中。采用该种手机中使用图像识别进行名片信息的采集与录入的方法，具有广泛的应用基础和应用前景；同时信息的采集由照相手机独立完成，无需任何附加的其它硬设备；而且解决了用户手动录入名片信息到电话本中速度慢的缺点；自动和手动模式的采集选择方案，进一步提高了信息采集的准确率和可选的信息采集录入速度，达到了更好的应用效果。

1、一种手机中使用图像识别进行名片信息的采集与录入的方法，其特征在于，所述的方法包括以下步骤： (1)手机通过拍摄镜头获取名片的图像信息； (2)手机对图像进行预处理； (3)手机对预处理后的图像进行版面分析和区域分割： (a)预先在手机中设置名片的版面模板； (b)将图像使用决策树进行模板匹配； (c)根据模板匹配的结果进行图像版面的区域分割处理； (4)手机对分割后各个区域进行文字识别； (5)手机对文字识别的内容进行数据识别和信息分析； (6)将数据存入手机的电话簿中。
2、根据权利要求1所述的手机中使用图像识别进行名片信息的采集与录入的方法，其特征在于，所述的获取名片的图像信息包括以下步骤：(1)将手机的拍摄镜头设置成高象素分辨率拍摄模式； (2 )将整张名片数据的完整拍摄录入。
3、根据权利要求1或2所述的手机中使用图像识别进行名片信息的采集与录入的方法，其特征在于，所述的图像的预处理包括以下步骤：(1)将图像进行二值化处理或灰度级别处理；(2 )以图像的边沿或文字的行向为基准进行倾斜度^^正。
4、根据权利要求l所述的手机中使用图像识别进行名片信息的采集与录入的方法，其特征在于，所述的名片的版面模板包括：(1) Tl ——单位、姓名及职称、地址三块依次由上至下排列，有两个地址块；(2) T2 —一单位、姓名及职称、地址三块依次由上至下排列，有一个地址块；(3) T3 —一姓名及职称放到最上部，有一个地址块；(4) T4 一一姓名及职称放到最上部，有两个地址块；(5) T5 —一单位块在最上部，姓名及职称块与地址并列；(6) T6 —一姓名及职称在最上部，单位、地址并列在下部；(7) T7 — —除去以上排版方式之外的其他方式。
5、根据权利要求4所述的手机中使用图像识别进行名片信息的采集与录入的方法，其特征在于，所述的使用决策树进行模板匹配包括以下步骤：(1) 手机根据用户操作预先设定空白间隔阈值；(2) 对图像自上而下垂直方向进行投影；(3 )判断图像中的空白间隔是否大于所述的空白间隔阈值；(4)如果不是，则匹配模板为T7，并进行手动交互方式确定版面区域分割处理；(5 )反之，则找到第一块；(6) 判断垂直方向是否可以继续投影；(7) 如果否，则判断水平方向是否可以继续投影，如果水平方向不可以继续投影，则匹配模板为T7，并进行手动交互方式确定版面区域分割处理；如杲水平方向可以继续投影，则匹配模板属于T5或者T6,并进一步采用水平和垂直投影完成模板匹配；(8) 如果是，则判断水平方向是否可以继续投影，如果水平方向不可以继续投影，则匹配才莫板属于T2或者T3，并进一步采用水平和垂直投影完成模板匹配；如果水平方向可以继续投影，则匹配模板属于Tl或者T4,并进一步采用水平和垂直投影完成模板匹配。
6、根据权利要求5所述的手机中使用图像识别进行名片信息的采集与录入的方法，其特征在于，所述的手动交互方式确定版面区域分割处理包括以下步骤：(1) 选择当前需要识别的字段名称；(2) 选择该字段的识别框的大小；(3) 选择后进入手机操作接口，并根据用户对方向键的操作来移动识别区域，进行识别区域的设定；(4 )重复步骤（1)至（3 ),直到将所需的识别内容全部确定。
7 、根据权利要求1或2所述的手机中使用图像识别进行名片信息的采集与录入的方法，其特征在于，所述的文字识别包括以下步骤：(1) 文本行字切分：将大幅的图像先切割为行，再从图像行中分离出单个字符；(2) 文字特征提取：从单个字符图像上提取统计特征或结构特征，包括细化和归一化；(3) 文字识别处理：从学习得到的特征库中找到与待识字符相似度最高的字符类。
8、根据权利要求4所述的手机中使用图像识别进行名片信息的采集与录入的方法，其特征在于，所述的对文字识别的内容进行数据识别和信息分析包括以下步骤：(l)将姓名块、单位块、职称块的识别结果与手^L电话簿中的姓名、单位名称和其它信息字段直接对应； (2) 将地址块中的文本内容进行字段抽^l处理。
9、根据权利要求8所述的手机中使用图像识别进行名片信息的采集与录入的方法，其特征在于，所述的地址块中的文本内容的结构为：〈地址块〉：••=〈字段1〉 i 〈字段2〉 I 〈字段3> ...〈字段i〉：：=〈先导词〉I 〈分界符〉i 〈内容〉〈内容〉：：=〈字符1〉 I 〈字符2〉 I 〈字符3〉... 分界符集合={':','.',' '}先导词、内容由字段种类决定，例如对电话字段有：先导词集合={'电话','TEL' ，' PHONE'.,. } 内容字符集={数位，'(',"'，'-V ','.'}, 所述的字IS:抽取处理包括以下步骤：(1)先导词容错匹配；(2 )跳过分界符；(3) 根据内容字符集判断内容是否合法；(4 )如果内容合法，则针对名片的专用词库和规则库为&出，自动校对识别结果并修改明显的错误；(5)反之，则回到步骤（1)。

手机中使用图像识别进行名片信息的采集与录入的方法\n技术领域\n本发明涉及手机领域，特别涉及手机图像信息识别处理领域，具体是指一种手机中使用图^^识别进行名片信息的采集与录入的方法。\n背景技术\n众所周知，印刷制作的名片是商业时代的产物，是人们个人信息交流的一种载体，受到了社会的广泛使用。但为了方便快捷的从数以百计的印刷制作的名片中找到所需的信息，却不是件容易的事，需要颇费一番功夫。将名片电子化可以^艮好的解决这个问题，可以快速的完成检索、归类等工作，方便用户的使用。为此目前市场上出现了众多的名片机或名片电子化软件，名片机是一种将印刷制作的名片电子化的专门设备，而名片电子化软件是利用图像识别技术对图像化后的名片进行信息分析和采集录入到计算机数据库中的一套软件解决方法。但这两种方案的实际使用率并不高，主要存在以下不足：\n(1 )使用不便捷，因为名片信息的采集和保存需要另外再配备一个专门硬设备或需要使用计算机来完成这个工作显得非常不方便，所以它们的实用价值未能被消费者广泛采纳；\n(2)因名片的印刷风格各异，名片机的信息自动采集效果欠佳，而通过计算机软件来完成这一工作则还需要配备专门的扫描仪，并且对后续获得的名片信息的转存、使用还需要存储到 PDA或移动电话等设备中才能方便用户外出的使用，存在存储格式（字段）匹配的问题。\n如何能够方便快捷的完成对名片的电子化过程，并可以达到随时方便的检索、应用名片电子化后的信息，是目前需要解决的问题。\n发明内容\n本发明的目的是克服了上述现有技术中的缺点，提供一种使用方便快捷、信息采集录入准确度较高、性能稳定、适用性较强的手机中使用图像识别进行名片信息的采集与录入的方法。\n为了实现上述的目的，本发明的手机中使用图像识别进行名片信息的采集与录入的方法如下：\n该手机中使用图像识别进行名片信息的采集与录入的方法，其主要特点是，所述的方法包括以下步骤：\n(1) 手机通过拍摄镜头获取名片的图像信息；\n(2) 手机对图像进行预处理；\n(3) 手机对预处理后的图像进行版面分析和区域分割；\n(4) 手机对分割后各个区域进行文字识别；\n(5 )手机对文字识别的内容进行数据识别和信息分析； (6 )将数据存入手机的电话簿中。\n该手机中使用图像识别进行名片信息的采集与录入的方法的获取名片的图像信息包括以下步骤：\n(1) 将手机的拍摄镜头设置成高象素分辨率拍摄模式；\n(2) 将整张名片数据的完整拍摄录入。\n该手机中使用图像识别进行名片信息的釆集与录入的方法的图像的预处理包括以下步\n骤：\n(1)将图像进行二值化处理或灰度级别处理；\n(2 )以图像的边沿或文字的行向为基准进行倾斜度^ft正。\n该手机中使用图像识别进行名片信息的采集与录入的方法的版面分析和区域分割包括以下步骤：\n(1) 预先在手机中设置名片的版面模板；\n(2) 将图像使用决策树进行模板匹配；\n(3) 根据模板匹配的结果进行图像版面的区域分割处理。\n该手机中使用图像识别进行名片信息的采集与录入的方法的名片的版面模板包括：\n(1) Tl 一一单位、姓名及职称、地址三块依次由上至下排列，有两个地址块；\n(2) T2 —一单位、姓名及职称、地址三块依次由上至下排列，有一个地址块；\n(3) T3 —一姓名及职称放到最上部，有一个地址块；\n(4) T4 一一姓名及职称放到最上部，有两个地址块；\n(5) T5 — —单位块在最上部，姓名及职称块与地址并列；\n(6) T6 —一姓名及职称在最上部，单位、地址并列在下部；\n(7) T7 —一除去以上排版方式之外的其他方式。\n该手机中使用图像识别进行名片信息的采集与录入的方法的使用决策树进行模板匹配包\n-括以下步骤：\n(1) 手机根据用户操作预先设定空白间隔阈值；\n(2) 对图像自上而下垂直方向进4亍投影；\n(3) 判断图像中的空白间隔是否大于所述的空白间隔阈值；\n(4) 如果不是，则匹配模板为T7，并进行手动交互方式确定版面区域分割处理；\n(5) 反之，则找到第一块；\n(6) 判断垂直方向是否可以继续投影；\n(7) 如果否，则判断水平方向是否可以继续投影，如果水平方向不可以继续投影，则匹配模板为T7，并进行手动交互方式确定版面区域分割处理；如果水平方向可以继续投影，则匹配模板属于T5或者T6 ，并进一步采用水平和垂直投影完成模板匹配；\n(8) 如果是，则判断水平方向是否可以继续投影，如果水平方向不可以继续投影，则匹配模板属于T2或者T3，并进一步采用水平和垂直投影完成模板匹配；如果水平方向可以继续投影，则匹配模板属于Tl或者T4，并进一步采用水平和垂直投影完成模板匹配。\n该手机中^f吏用图像识别进行名片信息的采集与录入的方法的手动交互方式确定版面区域分割处理包括以下步骤：\n(1)选择当前需要识别的字段名称； (2 )选择该字段的识别框的大小；\n(3 )选择后进入手机操作接口，并根据用户对方向键的操作来移动识别区域，进行识别区域的设定；\n(4 )重复步骤（1)至（3 ),直到将所需的识别内容全部确定。该手机中使用图像识别进行名片信息的采集与录入的方法的文字识别包括以下步骤：\n(1) 文本行字切分：将大幅的图像先切割为行，再从图像行中分离出单个字符；\n(2) 文字特征提取：从单个字符图像上提取统计特征或结构特征，包括细化和归一化；\n(3) 文字识别处理：从学习得到的特征库中找到与待识字符相似度最高的字符类。该手机中使用图像识别进行名片信息的采集与录入的方法的对文字识别的内容进行数据\n识别和信息分析包括以下步骤：\n(l)将姓名块、单位块、职称块的识别结果与手机电话簿中的姓名、单位名称和其它信息字段直接对应；\n(2 )将地址块中的文本内容进行字段抽取处理。\n该手机中使用图像识别进行名片信息的采集与录入的方法的地址块中的文本内容的结构\n为：\n〈地址块〉：：=〈字段1〉 I 〈字段2〉 I 〈字段3〉... 〈字段i〉：：=〈先导词〉I 〈分界符〉I 〈内容〉〈内容> 〈字符1〉 I 〈字符2〉 I 〈字符3> ... 分界符集合={':'，'.'，' '}\n先导词、内容由字段种类决定，例如对电话字ISL有：先导词集合={'电话','TEL',' PHONE'... }\n内容字符集-(数位，'('，'）'，'-v V.')，所述的字段抽取处理包括以下步骤： (1)先导词容错匹配； (2 )跳过分界符；\n(3 )根据内容字符集判断内容是否合法；\n(4 )如果内容合法，则针对名片的专用词库和规则库为&出，自动校对识别结果并修改明显的错误；\n(5)反之，则回到步骤（1)。\n采用了该发明的手机中使用图像识别进行名片信息的采集与录入的方法，由于本发明阐述的对名片信息的采集和录入方法是结合照相手机和图像识别技术完成的，同时随着科技发展曰新月异，照相手机随着象素功能的不断提升，目前已经出现了几百万象素的照相手机，其拍摄的照片效果几乎可以和专业相机拍摄的照片媲美，同时利用照相手机拍摄的图片分辨率也已经达到了图像识别处理的要求，结合这两点完成名片信息的采集和录入已经成为可能，并具有以下优点：\n(1) 因为移动电话已经达到了极大的普及，该项技术首先具有广泛的应用&出和应用前\n景；\n(2) 信息的采集由照相手机独立完成，无需任何附加的其它硬设备；\n(3) 将采集的信息保存在移动电话的电话本中，用户可以方便快捷的在任何需要的时候使用，解决了用户手动录入名片信息到电话本中速度慢的缺点；\n(4) 自动和手动模式的采集选择方案，进一步提高了信息采集的准确率和可选的信息采集录入速度，达到了更好的应用效果。\n附图说明\n图1为本发明的手机中使用图像识别进行名片信息的采集与录入的方法的流程图，\n图2为本发明的对名片图像使用决策树进行模板匹配的流程图。\n图3为本发明的对名片图像区域分割结果示意图。\n图4为本发明的对地址块进行字段抽取处理的流程图，\n图5 ( a ) ( b ) ( c ) ( d ) ( e ) ( f )为本发明的手动交互式信息采集识别过程示意图。具体实施方式\n为了能够更清楚地理解本发明的技术内容，特举以下实施例详细说明。本发明首先将照相手机设置成高象素分辨率的拍照模式，将需要电子化的名片一一拍摄录入到手机中。对名片图像利用名片版面的位置信息和名片知识分析名片版面的属性，将名片信息进行分割，分割方法可以选择采用自动分割或由用户交互给出，之后对分割的各个区域进行字符识别，并对识别结果做基于名片和词语的后处理，最后从识别结果中提取有用信息存储到手机电话本的各个域段中，完成名片信息的采集和电话本信息的自动录入过程，请参阅图l所示，该手机中使用图像识別进行名片信息的采集与录入的方法包括以下步\n骤：\n(1)手机通过拍摄镜头获取名片的图像信息，包括以下步骤：\n(a) 将手机的拍摄镜头设置成高象素分辨率拍摄模式；\n(b) 将整张名片数据的完整拍摄录入。\n(2 )手机对图像进行预处理，包括以下步骤：\n(a) 将图像进行二值化处理或灰度级别处理；\n(b) 以图像的边沿或文字的行向为基准进行倾斜度校正。\n在实际应用当中，为获得较好的系统处理图像，提高后续的分析和识别效果，在用照相手机拍摄名片时需要注意几点，一是将照相手机设置成较高象素分辨率拍摄模式，二是保证整张名片数据的完整拍摄录入，以方便系统后续对名片版面的自动分析。得到名片图像后进行必要的图像预处理，主要分成两个步骤完成，一个是将图像进行二值化处理（或灰度级别处理）以减少背景噪音的干扰，还可以在此过程中运用其它減少图像噪音的方法，目的是突出需要处理的有用数据信息。之后对图像进行倾斜度校正，以名片的边沿或文字的行向为基准进行校正，以使后续的版面分析和识别效率更理想。完成图像预处理后就可以开始真正的名片信息分析和处理的核心过禾呈了。\n(3 )手机对预处理后的图像进行版面分析和区域分割，包括以下步骤：\n(a )预先在手机中设置名片的版面模板，包括：\n(i) Tl — 一单位、姓名及职称、地址三块依次由上至下排列，有两个地址块；\n(ii) T2 ——单位、姓名及职称、地址三块依次由上至下排列，有一个地址块；\n(iii) T3——姓名及职称放到最上部，有一个地址块；\n(iv) T4——姓名及职称放到最上部，有两个地址块；\n(v) T5 —一单位块在最上部，姓名及职称块与地址并列；\n(vi) T6 — —姓名及职称在最上部，单位、地址并列在下部；\n(vii) T7 ——除去以上排版方式之外的其他方式。\n(b)将图像使用决策树进行模板匹配，请参阅图2所示，包括以下步骤： (i )手机根据用户操作预先设定空白间隔阈值；\n(ii) 对图像自上而下垂直方向进行投影；\n(iii) 判断图像中的空白间隔是否大于所述的空白间隔阔值；\n(iv) 如果不是，则匹配模板为T7,并进行手动交互方式确定版面区域分割处理；\n(v) 反之，则找到第一块；\n(vi) 判断垂直方向是否可以继续投影；\n(vii) 如果否，则判断水平方向是否可以继续投影，如果水平方向不可以继续投影，则匹配模板为T7,并进行手动交互方式确定版面区域分割处理；如果水平方向可以继续投影，则匹配模板属于T5或者T6,并进一步采用水平和垂直投影完成模板匹配；\n(viii) 如果是，则判断水平方向是否可以继续投影，如果水平方向不可以继续投影，则匹配模板属于T2或者T3,并进一步采用水平和垂直投影完成^莫板匹配；如果水平方向可以继续投影，则匹配模板属于Tl或者T4，并进一步采用水平和垂直投影完成模板匹配。\n其中，手动交互方式确定版面区域分割处理包括以下步骤：\n(1) 选择当前需要识别的字段名称；\n(2) 选择该字段的识别框的大小；\n(3 )选择后进入手机操作接口，并根据用户对方向键的操作来移动识别区域，进行识别区域的设定；\n(4 )重复步骤（1)至（3 ),直到将所需的识别内容全部确定。\n在实际应用当中，图像的版面分析可以采用自动和手动两种方式进行，版面自动分析是利用名片版面的位置信息和名片知识分析名片版面的属性，将名片版面进行分割处理。另一方面，为了提高分析和识别的时效性，剔除用户不需要的信息，也可以由用户交互完成这一工作。因名片在不大的面积上集中了众多的信息，各种信息往往会在一定位置上分布，从而使版面可以被大致分为单位块、姓名块、职称块、地址块等，而且块的大致位置也有规律性，如：姓名往往与职称放在一起，地址块多在名片的下部，单位块大多在上部或中部。名片上除含有上述基本信息外，为了美观还常有其它装饰性要素，主要有两种：图示和水平分隔线。其中图标多为单位的标志，水平分隔线起内容分割作用。名片版面的一个重要特点是：各块的相对位置较为稳定。根据收集到的近200张各式名片得到如下表的分类结果。\n表l名片版面分类\ntable see original document page 11\n

有了以上的模板分类后，我们可以采用模板匹配的方法解决版面分析的问题。把上面的\n七类版面作为模板(Tl, T2, T3， T4， T5, T6, T7),对输入的名片进行匹配，看它属于哪一种。一种最直接的想法是顺序匹配，但这样做在最坏情况下要匹配七次，匹配的时效性无法接受（因为底层操作是象素的投影，比较费时）。考虑各模板间有相似性，可以用决策树实现\n模板匹配。在确定模板类型后再用一些细微特征可消除水平分隔线和图示的影响，并把姓名和职称分开。当系统中空白信息没有达到门限时可能会造成^"i吴发生，所以当有错误发生时,\n空白间隔d。由用户可以交互的给出。从表2版面分析效果可以知道,整版正确率可以达到91%,\n考虑到名片格式的多样性，这种自动版面分析效杲还是比较理想的，同时时效性也可以达到\n移动电话中处理的要求。请参阅图3所示，其是应用该算法的一个处理例子示意图。\n表2 版面分析效果\n

table see original document page 12\n

\n(c )根据模板匹配的结果进行图像版面的区域分割处理。\n(4 )手机对分割后各个区域进行文字识别，包括以下步骤：\n(a) 文本行字切分：将大幅的图像先切割为行，再从图像行中分离出单个字符；\n(b) 文字特征提取：从单个字符图像上提取统计特征或结构特征，包括细化和归一化；\n(c) 文字识别处理：从学习得到的特征库中找到与待识字符相似度最高的字符类。 (5 )手机对文字识别的内容进行数据识别和信息分析，包括以下步骤：\n(a)将姓名块、单位块、职称块的识别结果与手;f几电话簿中的姓名、单位名称和其它信息字段直接对应； (b)将地址块中的文本内容进行字段抽取处理，请参阅图4所示，包括以下步骤：\n(i) 先导词容错匹配；\n(ii) 跳过分界符；\n(iii) 根据内容字符集判断内容是否合法；\n(iv )如果内容合法，则针对名片的专用词库和规则库为基础，自动校对识别结果并修改明显的错误； (v)反之，则回到步骤（i )。在实际使用当中，在进行文字的识别过程中，大致包括三个内容：文本行字切分，文字特征提取和文字识別处理。行字切分是将大幅的图像先切割为行，再从图像行中分离出单个字符的过程。特征提取是整个环节中最重要的一环，它是从单个字符图像上提取统计特征或结构特征的过程，包括为此而做的细化（Thinning)、归一化（Normalization)(将大小不同\n的字体规一）等步骤。提取的特征的稳定性及有效性，直接决定了识別的性能。文字识別即从学习得到的特征库中找到与待识字符相似度最高的字符类的过程。通过文字识别后就得到了各个分割区域的文字内容，接下来为了实现相应内容自动填充到电话本中相应的字段中，需要考虑相关内容的匹配问题。姓名块、单位块、职称块的识别结杲可与电话本中的姓名、单位名称和其它信息等字段直接对应，但地址块就复杂多了，有住址、电话、电传、传真、电子邮件、邮政编码等多项内容，这些内容无法用版面分析分开（这就是前面把它们放在一起作版面分析的原因），只能靠对识别结果上下文的理解。一般的语言的理解是比较困难的，但名片信息有着明显的特殊性。最明显的一点是各字段多以明显的先导词开头，如：电话号码前常见"电话"、"TEL"、 "PHONE"等字样。但实验表明只利用先导词匹配结果并不很理想，原因是：（1)尽管字符识别程序的单字识别率很高，但对多个字符组成的先导词则不一定能认对；（2)光靠先导词容易错分，例如：会因先导词"TEL"的存在把"TELEVISION STATION" 看成电话号码。改进的方法是进行细致的句法分析，地址块的文本有下面的结构：\n〈地址块〉：：=〈字段1〉 I 〈字段2〉 I 〈字段3〉...\n〈字段i〉：：=〈先导词〉I <分界符〉I 〈内容〉\n〈内容〉：：=〈字符1〉 I 〈字符2〉 i 〈字符3〉... 分界符集合={':','.',' '}\n先导词、内容由字段种类决定，例如对电话字段有：先导词集合={'电话'，'TEL' ，' PHONE'... } 内容字符集={数位，'(V)'，'-'，' '，'•"\n注意，这里采用了先导词的容4酱匹配，即：只要有先导词的部分字就认为找到了先导词。之\n所以能这样做是因为后面还要判决内容的合法性，不必担心先导词找错了。这种基于句法分\n析的字段抽取算法有很强的鲁棒性，在字符识别效果一般的情况下都能正确提取出各字段。\n对识别后的信息进行分析的另一个作用是以针对名片的专用词库和规则库为^s出，自动校对\n识别结果，修改明显的错误。下面给出一个后处理的例子，其中加下划线的字识别程序认错\n了，但通过后处理均被纠正了。\n处理前：地址：中国北京复兴门外罗道庄\n^^舌：81. 0631 (总机）\n81, 2105 (直拨）\n电挂：8681\n邮政缝码：1000^6 处理后：地址字段[中国北京复兴门外罗道庄] 电话字段[8L 0631 (总机）81. 2105(直拨）] 电桂字段[8681] 邮政编码字段[100086 ]\n(6 )将数据存入手机的电话簿中。\n再请参阅图5所示，对于确认为T7模板类型的名片，因为其存在较复杂的排版格式，无法按照正常的自动识别过程，系统同时提供了用户交互识别完成这类信息的识别录入功能。具体情况如下：\n打开电话本后选择功能按钮后进入（a ),选择（b )名片识别采集进入（c )操作接口，此时可以选择自动识别采集和手动识别采集，在选择自动识别采集会提示是否采用默认d。值进行版面分割，用户可以采用默认值或当自动识别有误时再选择修改d。值进行自动识别。同时当按照自动识别流程判定该名片模板属于T7时也会提示自动进入该页面进行手动识别操作。选择手动识别进入（d )选择手动交互识别选项设置，比如当前选择将识别字段填充为电话本的姓名字段内，并选择识别框的大小，以便最快速的进行识别操作。选定后进入（e)操作接口，可以通过方向键移动识别区域完成识别区域的设定，（d )和（e )可以反复进行以便将所需的识别内容全部选定。当至少已经有一个识别区域^t选定后，返回到（e )接口时系统菜单中会自动增加开始识别采集信息的功能选项，选择开始识别操作后，系统将自动将相应的字段信息填充到电话簿的相应内容中如（f ),若需要修正或更改可在此处完成。\n在此说明书中，本发明已参照其特定的实施例作了描述。但是，很显然仍可以作出各种修改和变换而不背离本发明的精神和范围。因此，说明书和附图应被认为是说明性的而非限制性的。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN1561126A	2005-01-05	2004-02-18	名片信息转化到手机电话本中的方法有效专利	惠州TCL移动通信有限公司
2	CN1630302A	2005-06-22	2003-12-17	可自动录入文字、图像的手机及其录入与处理方法有效专利	大唐移动通信设备有限公司;上海大唐移动通信设备有限公司
3	CN1592340A	2005-03-09	2003-08-27	具有名片扫描辨识功能的移动电话系统失效专利	致伸科技股份有限公司

被引用专利（该专利被哪些专利引用）

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN104298982B	2013-07-16	2013-07-16	一种文字识别方法及装置有效专利	深圳市腾讯计算机系统有限公司

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供