著录项信息
专利名称 | 以直线段为主的手写体字符的预处理方法和手写体识别设备 |
申请号 | CN96194490.0 | 申请日期 | 1996-04-26 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 1998-07-08 | 公开/公告号 | CN1187256 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 摩托罗拉公司 | 申请人地址 | 美国伊利诺斯
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 摩托罗拉移动公司 | 当前权利人 | 摩托罗拉移动公司 |
发明人 | 凯恩南·帕塞萨尔泰;约翰L·C·西博尔德 |
代理机构 | 中国国际贸易促进委员会专利商标事务所 | 代理人 | 吴丽丽 |
摘要
本发明的方法和微处理器包括计算手写体输入(108)中的角度变化值,选择角度变化值大于阈值(110)的潜在分割点,并用这些分割点确定一系列直线段笔画供识别器解释手写体输入。
1.一种对由以直线段为主构成的字符的手写体笔输入进行预处 理的方法,包括步骤:
接收(x,y,pen)点序列形式的手写体输入,其中x和y是一 个两维坐标系统中的坐标,pen表示笔的抬笔或落笔状态;
确定在每个点处的角度变化值;
将具有局部最大角度变化值,并且其角度变化值超过一个预定阀 值的那些点的每一个识别为潜在分割点;
将伪分割点消除,以提供有用的分割点,其中将与潜在分割点中 的另一个潜在分割点的距离小于预定距离的那些潜在分割点定义为伪 分割点;
从有用分割点中确定一个直线段笔画序列来表示手写体输入;
在其间具有一个抬笔段的任意两个连续有用分割点之间插入一 个直线段笔画。
2.权利要求1的方法:还包括,在接收手写体输入之后,将x、 y坐标进行比例变换,从而使得到的结果坐标值在预先指定的限制内 的步骤。
3.权利要求1的方法,进而包括在接收手写体输入之后将x,y 坐标平滑以去除高频噪声的步骤。
4.权利要求1的方法,其中确定一个直线段笔画序列的步骤包 括,在任何两个有用连续分割点之间插入一个直线段笔划的步骤。
5.权利要求1的方法,其中用四个参数描述每个直线段笔画: 即直线段笔画的中点的x坐标,直线段笔画的中点的y坐标,直线段 的长度,及直线段笔画相对于一个预定参照物的角度。
6.一种手写体识别设备,用于响应接收到的作为(x,y,pen) 点序列的手写体字符输入,识别由多个(x,y,pen)值构成的手写体 字符,其中x和y是两维坐标系统中的坐标,pen表示笔的抬笔或落 笔状态,包括:
角度变化确定器,用于确定在(x,y,pen)点序列中每个点处 的角度变化值;
潜在分割点识别器,与该角度变化确定器相连,用于将具有局部 最大角度变化值,并且其角度变化值超过一个预定阀值的那些点的每 一个识别为潜在分割点;
仿真消除器,与该潜在分割点识别器相连,用于将伪分割点消除, 以提供有用的分割点,其中将与潜在分割点中另一个潜在分割点的距 离小于预定距离的那些潜在分割点定义为伪分割点;
笔画确定器,与该仿真消除器相连,用于从有用分割点中确定一 个直线段笔画序列来表示手写体输入,在其间具有一个抬笔段的任意 两个连续有用分割点之间插入一个直线段笔画。
7.权利要求6的设备:还包括一个比例变换器,用于接收(x, y,pen)点序列,对x、y坐标进行比例变换,从而使结果坐标值在预 先指定的限制内,并将比例变换后的x,y坐标提供给角度变化确定器。
8.权利要求6的设备,进而包括一个平滑处理器,用于接收(x, y,pen)点序列,将x,y坐标平滑以去除高频噪声。
9.权利要求6的设备,还包括在任何两个有用连续分割点之间 插入一个直线段笔划的装置。
10.权利要求6的设备,其中用四个参数描述每个直线段笔画: 即直线段笔画的中点的x坐标,直线段笔画的中点的y坐标,直线段 的长度,及直线段笔画相对于一个预定参照物的角度。
技术领域\n本发明一般涉及手写体识别,尤其涉及手写体输入的直线段笔画的识 别方法。\n背景技术\n人类手写体的机器识别是一项非常困难的问题,而且近年来随着基于 笔式计算机设备的剧增,它成为待解决的重要研究问题。对于这个问题的 解决已有许多不同的方法,但一种有效的方法是将手写体划分为一序列的 基本移动或“笔画”,并使用这种笔画(用某些方法参数化)输入到基于 笔画的字符识别器中。\n在基于笔画的识别器中的一项关键要求是同一字符类的多个实例 (如:不同时候和不同书写者所写的字母“A”)应该每次都被划分到相 似的笔画集中,这将有助于确保识别不会太难,因为字符实例的描述将“看 起来”象字符识别器中的描述。在理想情况下,一个给定字符的所有实例 应该总是包含着同样的笔画数,这些笔画都应该在同样的相关位置,并且 它们的特征描述在所有的实例中都应非常相似。这种理想情况在实际中是 不可达到的,但在某中程度上是可以接近的,识别精度也可以提高。\n在现有技术中,笔画边界设置在笔的移动速度在垂直(或“Y”)方 向为零的点处,即在书写开始向上移动、或向下移动的点处。于是笔画的 结果集被称为“向上笔画”和“向下笔画”。这种方法在Mermelstein & Eden, “手写体连写词的计算机识别实验”,信息和控制第7卷255-270页,1964 中有所讨论。此方法存在的一个问题是对垂直方向的变化完全敏感,而对 水平方向的变化一点也不敏感。然而许多字符是由水平段组成的例如: 在字母“t”的交叉和字母“E”的三叉处,水平段比垂直段多,即使在 斜体书写时也是如此。一个基于Y速度的笔画分段方法应该将一个水平段 划分为一画,但仅仅因为在垂直方向的微小跳动,水平段经常被划分为二 画,三画,甚至更多画,这就导致了较低的识别精度,因为同一字符的多 个实例将经常被划分为看起来不同的笔画集。修正这种方法不精确性的尝 试虽然取得了一些成功,包括在创建一个新笔画之前设定一个最小的垂 直方向变化量,但是许多同样的基本问题仍未解决。\n相应地,笔画划分技术要求更精确一些,并且它不受在以上讨论方 法中问题的影响,象Y-速度(Y-velocity)法。\n发明内容\n本发明提供一种对由以直线段为主构成的字符的手写体笔输入进 行预处理的方法,包括步骤:接收(x,y,pen)点序列形式的手写体 输入,其中x和y是一个两维坐标系统中的坐标,pen表示笔的抬笔或 落笔状态;确定在每个点处的角度变化值;将具有局部最大角度变化值, 并且其角度变化值超过一个预定阀值的那些点的每一个识别为潜在分 割点;将伪分割点消除,以提供有用的分割点,其中将与潜在分割点中 的另一个潜在分割点的距离小于预定距离的那些潜在分割点定义为伪 分割点;从有用分割点中确定一个直线段笔画序列来表示手写体输入; 在其间具有一个抬笔段的任意两个连续有用分割点之间插入一个直线 段笔画。\n本发明提供一种手写体识别设备,用于响应接收到的作为(x,y, pen)点序列的手写体字符输入,识别由多个(x,y,pen)值构成的手 写体字符,其中x和y是两维坐标系统中的坐标,pen表示笔的抬笔或 落笔状态,包括:角度变化确定器,用于确定在(x,y,pen)点序列 中每个点处的角度变化值;潜在分割点识别器,与该角度变化确定器相 连,用于将具有局部最大角度变化值,并且其角度变化值超过一个预定 阀值的那些点的每一个识别为潜在分割点;仿真消除器,与该潜在分割 点识别器相连,用于将伪分割点消除,以提供有用的分割点,其中将与 潜在分割点中另一个潜在分割点的距离小于预定距离的潜在分割点定 义为伪分割点;笔画确定器,与该仿真消除器相连,用于从有用分割点 中确定一个直线段笔画序列来表示手写体输入,在其间具有一个抬笔段 的任意两个连续有用分割点之间插入一个直线段笔画。\n附图说明\n图1是根据本发明的实施方案的识别笔画边界操作的流程图。\n图2展示了根据本发明的一个实施方案在图1中110步之后,产生 的手写体输入分割点。\n图3展示了根据本发明的一个实施方案在图1中112步之后产生的 手写体输入分割点。\n图4展示了一序列表示图2中手写体输入的直线段(笔画)。\n图5展示了确定一序列表示手写体输入的直线段(笔画),其中要 抬起输入笔(阴影线)。\n图6是在确定角度过程中说明角度变化的分解图。\n图7图示性地展示了为图6中每点计算的角度变化值。\n图8是根据本发明用于识别直线段为主的手写体字符的手写识别 微处理器/设备的框图。\n具体实施方式\n一般来说,手写体字符输入是从用户那里以独立连续段的形式收集 的。一个独立连续段由一个或多个笔段组成,一个笔段是指在笔与输入设 备象数字输入板或纸接触期间由笔留下的标志。\n在本发明中,一个或多个独立连续段是被划分为笔画的手写体输入的 基本单元。一个笔画是实际手写体输入的直线段近似,手写体输入是电子 捕捉方式的输入,它包括但不局限于以下方式:手写体输入;电子化输入; 压力捕捉方式输入;象印模(stamped)输入;电子接受方式输入,象传 真;寻呼机,或其它设备。\n一个段可表示为一序列的点,这些点通过输入设备以几乎规则的间隔 取样,每个点至少需一个X坐标,一个Y坐标和一个笔状态来描述。笔状 态表示笔是否与输入板接触,而且只能取两个值中的一个值(抬笔和落 笔)。段可通过使用数字化输入板来获得或者通过对图象进行线监测处理 从扫描图象或传真图象中获得。象这种电子获取方法在技术上是可以理解 的。在本发明的优选方法中,某些设备,象个人数字辅助器(PDA)或其 它设备可以接收手写体输入。具有接收手写体输入功能的其它设备包括但 不局限于下列各设备:计算机,调制解调器,寻呼机,电话,数字化电视, 交互式电视,具有数字化输入板的设备,传真设备,扫描设备及其它可以 获得手写体输入的设备。一般来说,当手写体输入被电子捕捉后,每个点 可表示为一个象素点,因此,一个段就可表示为设备上一系列象素点。\n根据本发明,手写体输入的字符可以是字母,表意字符或者用于书面 联系的其它形式字符或符号。\n在本技术中,笔画边界设在角度变化值局部极大值处,且该值超过了 预定的、反映书写中形状弯曲程度的阈值。由于形状弯曲总会发生,而不 考虑笔的移动方向,因此这种方法就会导致对手写体输入的不同部分,如 单词或字符不灵敏。参照图1,图1展示了本发明方法的流程图。来自数 字化装置或其它装置的手写体输入以X,Y坐标和抬笔,落笔状态(102) 的形式被接收。一般来说,这些点以象素点表示。被选择的这些象素点的X, Y输入坐标需经过比例变换(104),以便变换后的坐标值在预先规定的限 度内,经过比例变换的X,Y坐标还要经过平滑处理以消除由数字化输入 装置引起的高频躁声。平滑处理是通过计算某一点及其相邻的点的坐标 (X,Y)的平均值而得到的,(将该点与离它最近的较高的点加权), 并用该平均值代替该点的(X,Y)坐标值。理想情况下,平滑处理的窗 口大小是固定不变的。如果相互分离的落笔状态的两条线段交叉时,就不 进行平滑处理。连结前面的点到当前点就形成了第一个矢量,连结当前点 到当下一个点就形成了第二个矢量。第一个矢量与第二个矢量之间的夹角 就确定下来(108),其为当前点的角度变化值(见图6)。位于角度变 化值极大值处且超过了预定的阈值(110)(见图7)的潜在分割点被认 为是落笔点。可通过选择阈值来使真分割点尽可能多,使伪分割点尽可能 少(如由颤动产生的分割点),这样就消除了伪分割点(112),例如: 钩,也就是,先消除在落笔段首/尾处的小距离笔移动,并且当第一个分割 点处的角度变化值小于第二个分割点处的角度变化值且该点位于离第一个 分割点的预定的范围内,就删除第一个分割点,这样从有用的分割点内就 可确定一序列直线段笔画(114)。当两个分割点之间是抬笔状态时,也 在它们之间引入一条直线段。\n每个直线段笔画一般用四个参数描述:直线段中点的X坐标,直线段 中点的Y坐标,直线段的长度及它相对于预定参考系的角度。\n参见图2和图3,图2展示了图1中110步之后,由本发明的实施方 案产生的手写体输入分割点。这些分割点来自于局部角度变化值极大值处 且该值超过了预定阈值,还来自落笔段的首尾处。因此在图2中就确定了 段(201,202,204,206,208,210,212,214,216,218)。 每条线段的边界由两个分割点来确定。\n图3展示了图1中112步之后,由本发明的实施方案产生的手写体输 入分割点(302)。注意,图1中的分割点220在图3中消除了。即线段 201表示一个“钩”,即人为现象(artifact),就消除分割点220。决定 分割点220是伪分割点的规则是该点到分割点222的距离小于预定的距 离,分割点222同分割点220相比有较大的角度变化值。\n图4展示了图2中手写体输入的一连串直线段笔画(402),图3中 的任意两个连续分割点之间的点的序列用图4中的直线来代替。\n有时笔需要从输入设备上抬起(抬笔段)并在一个新位置放下以继续 进行手写输入,在图5中展示了这个例子。虚线(502)表示笔在该处笔 抬起的线段。在预处理末期,抬笔笔画与落笔笔画是不可分辨的。\n图6是说明角度变化的分解图。第一个矢量(602)连结前一点K-1(来 自原始输入数据)与当前点K,第二个矢量(604)连结当前点K与下一点 K+1,两个矢量之间夹角就是K点的角度变化值。在落笔段的开始点处及结 束点处,角度变化值赋为零。\n图7图示性地展示了为图6中各点计算的角度变化值与原始点K之间 的关系,图6中的各点用序号K标志。该图显示了角度变化的三个极大值 (702,704,706),极大值702和704超过了预定阈值708,因此被 选为潜在分割点。然而极大值706小于阈值708,因此不作为分割点。由 于702和704表示的点之间的距离小于预定的距离阈值,因此两个表示极 大值的点中仅有一个是有用分割点,另一个是伪分割点。既然极大值702 大于极大值704,那么极大值702表示的点是有用分割点,而极大值704 表示的点则是伪分割点。\n两个阈值必须估计。为了选择潜在分割点,第一个阈值用于在角度变 化曲线(图7)局部极大值处比较角度变化值。第二个阈值用于比较两个 分割点之间的距离,以便区分有用分割点和伪分割点。当本发明的预处理 方法用于手写体字符识别器上后,只要使用了容错字符识别器,那么以上 两个阈值的精确值就不重要了。在为建立当本发明的一个具体实施方案而 进行这些或其它参数的实验性调整时,追求的目标是在典型字符类的多个 实例中尽可能获得一致的分割点。这完全可以通过检查生成的段如何随着 被识别的手写体的实际样本变化来实现。\n根据本发明,分割点的集合定义了一套相应的直线段笔画。这些笔画 发送给基于笔画的字符识别器以进行手写体输入识别。\n如图8所示,手写体识别微处理器/设备也可以使用本发明。它接收到 如(X,Y,PEN)点序列的手写体字符输入时,就识别由大量(X,Y, PEN)值组成的手写体字符,其中X和Y是二维坐标系中的坐标且PEN是表 示抬笔/落笔状态的二进制数值。该设备/手写体识别微处理器包括一个角 度变化确定器(806),一个潜在分割点识别器(808),一个仿真消除 器(810)和一个笔画确定器(812)。所述的设备/微处理器可以选择地 至少包括下列之一:一个比例转换器(802)和一个平滑处理器(804)。 比例转换器(802)用于对X,Y坐标进行比例转换,以便转换后的值在 预定的范围内。平滑处理器在角度变化确定器(806)之前,或与比例转 换器一起运行(这里比例转换器被使用),它对比例转换后的X,Y坐标 值进行平滑处理以消除高频噪声。角度变化确定器(806)接收(X,Y, PEN)点序列,并确定每个(X,Y,PEN)点的角度变化值。角度变化确 定器也可以接收比例转换器(802)和平滑处理器(804)二者之一的输 出。潜在分割点识别器(808)与角度变化确定器相连,识别角度变化值 超过阈值的落笔点为潜在分割点。仿真消除器(810)与潜在分割点识别 器(808)相连,用于消除伪分割点以提供有用的分割点。笔画确定器 (812)与仿真消除器(810)相连,用于从有用分割点中确定一系列直 线段笔画来表示手写体输入。\n在另一个实施方案中,设备/手写体识别微处理器可能包括:A>一个 角度变化确定器(806),用于接收(X,Y,PEN)点,并确定每个(X, Y,PEN)点的角度变化值。B>与角度变化确定器相连的点-笔画描述器, 用于确定有用分割点,并从这些有用点中生成一系列直线段笔画来表示手 写体输入。可以选择性地包括一个数值调整器(814),它连接在角度变 化确定器(806)之前,用于接收一系列(X,Y,PEN)值,并调整所 述值以利处理,并向角度变化确定器(806)提供调整后的值。\n例如,数值调整器(814)可以选择性地包括:A>比例转换器 (802),用于比例转换X,Y坐标以使转换后的值在预定范围内。B>平 滑处理器(804),与比例转换器相连,用于对转换后的X,Y坐标值进 行平滑处理以消除高频噪声。\n在一种实施方案中,点-笔画描述器(816)可以包括:A>一个潜在 分割点识别器(808),与角度变化确定器(806)相连,用于将角度变 化极大值超过了阈值的落笔点识别为潜在分割点。B>一个仿真消除器 (810),与潜在分割点识别器(808)相连,用于消除伪分割点以提供 有用的分割点。C>笔画确定器(812),与仿真消除器(810)相连,用 于从有用分割点中确定一系列直线段笔画来表示手写体输入。\n显然,本发明的方法可以在可见介质/计算机上实现,例如:可见介质 可能是计算机磁盘,或计算机存储单元。\n本发明及其优选实施方案涉及新颖的、更精确的以直线段为主的字符 的笔画分割方法(例如,汉字)。根据本发明,在手写体输入的多个实例 中,输入的字符每次都被重复地划分为相似的直线段笔画集,通过一个基 于笔画的字符识别器,这种笔画分割方法可提供更精确的说明。\n熟练的技术人员会发现本发明的许多实施方案是很用的。一个明显的 用处是使印刷体和写出的草书更相似,因此使识别更容易;另一个实施例 是可将扫描的或“非在线”的手写段分割为笔画。对这种情况来说,采用 本发明的直接方法是对手写体进行细化以得到定宽点曲线,由于缺少暂时 信息使得交叉点和接触弯曲点很相似,因此笔画边界可设定在角度变化极 大值处和交叉点处。\n对熟练的技术人员来说,本公开发明可以进行种种修改,除了特别提 出及描述的实施例外,还可以有更多的实施例。因此附加的权利要求书包 含了属于本发明精神和范围内的所有修改及与其等价物。
法律信息
- 2016-05-25
专利权有效期届满
IPC(主分类): G06K 9/60
专利号: ZL 96194490.0
申请日: 1996.04.26
授权公告日: 2003.09.17
- 2011-03-02
专利权的转移
登记生效日: 2011.01.14
专利权人由摩托罗拉公司变更为摩托罗拉移动公司
地址由美国伊利诺斯变更为美国伊利诺斯
- 2003-09-17
- 1998-07-15
- 1998-07-08
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| | 暂无 |
1984-10-03
| | |
2
| | 暂无 |
1989-10-13
| | |
3
| | 暂无 |
1984-12-24
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2015-07-09 | 2015-07-09 | | |
2 | | 2015-07-09 | 2015-07-09 | | |