著录项信息
专利名称 | 文字识别方法、数据修正历史处理方法和文字识别系统 |
申请号 | CN200510084206.8 | 申请日期 | 2005-07-15 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2006-01-18 | 公开/公告号 | CN1722154 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/68 | IPC分类号 | G;0;6;K;9;/;6;8查看分类表>
|
申请人 | 株式会社日立制作所 | 申请人地址 | 日本东京都
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 株式会社日立制作所 | 当前权利人 | 株式会社日立制作所 |
发明人 | 甲能正隆 |
代理机构 | 北京银龙知识产权代理有限公司 | 代理人 | 郝庆芬 |
摘要
本发明提供一种文字识别方法,其接收将设备标识符和文字图像数据以及修正后的文字编码对应的信息并存储;判断修正历史表中的各记录的信息是否满足预定条件;从修正历史表中提取文字图像数据,并进行差分检测处理,生成新的文字图像数据;将新的文字图像数据和文字编码以及设备标识符对应起来的信息存储到附加表;判断在附加表中是否存在与文字识别处理指示同时接收到的设备标识符,根据判断结果进行文字识别处理,差分检测处理是求出基本表中和所提取出的文字图像数据的坐标数据之间的差分及其平均值,并与基本表中的文字图像数据的坐标数据进行相加。从而更忠实地捕捉每个笔者的手写文字图像的特征,进一步得到每个笔者不同的手写文字的特征。
1.一种文字数据的修正历史处理方法,其特征在于,
接收将设备标识符和文字图像数据以及修正后的文字编码对应起来的信 息;
将所述接收到的信息作为新记录存储到修正历史表;
判断所述修正历史表中包含的各记录是否满足预先规定的条件;
根据所述判断结果,从修正历史表包含的记录中提取多个文字图像数据;
通过对所述提取出的文字图像数据进行差分检测处理,生成新的文字图 像数据;
发送将所述新的文字图像数据和所述修正后文字编码以及所述设备标识 符对应起来的信息,其中
所述差分检测处理是分别求出在存储了将预先规定的文字图像数据和文 字编码对应起来的记录的基本表中所包含的文字图像数据的坐标数据和从所 述修正历史表中提取出的多个文字图像数据的坐标数据之间的差分,求出所述已求出的差分的坐标数据的平均值的坐标数据,
对所述已求出的平均值的坐标数据和基本表中所包含的文字图像数据的 坐标数据进行加法运算。
2.根据权利要求1所述的修正历史处理方法,其特征在于,
所述预先规定的条件是在所述修正历史表中存在多个包含与所述接收到 的设备标识符和所述接收到的修正后的文字编码为同一设备标识符和文字编 码的记录。
3.一种文字识别方法,其特征在于,
接收将设备标识符和文字图像数据以及修正后的文字编码对应起来的信 息;
将所述接收到的信息作为新记录存储到修正历史表;
判断所述修正历史表中包含的各记录的信息是否满足预先规定的条件;
根据所述判断结果,从修正历史表包含的记录中提取多个文字图像数据;
通过对所述提取出的文字图像数据进行差分检测处理,生成新的文字图 像数据;
将所述新的文字图像数据和文字编码以及设备标识符对应起来的信息存 储到附加表;
在接收到文字识别处理指示的同时,接收到将设备标识符和文字图像数 据对应起来的信息时,
判断在所述附加表中是否存在与所述文字识别处理指示同时接收到的设 备标识符;
在所述判断结果为在所述附加表中存在与所述文字识别处理指示同时接 收到的设备标识符时,根据所述附加表进行文字识别处理;
在所述判断结果为在所述附加表中不存在与所述文字识别处理指示同时 接收到的设备标识符时,根据存储了将预先规定的文字图像数据和文字编码 对应起来的记录的基本表,进行文字识别处理,其中所述差分检测处理是分别求出在存储了将预先规定的文字图像数据和文 字编码对应起来的记录的基本表中所包含的文字图像数据的坐标数据和从所 述修正历史表中提取出的多个文字图像数据的坐标数据之间的差分,求出所述已求出的差分的坐标数据的平均值的坐标数据,
对所述已求出的平均值的坐标数据和基本表中所包含的文字图像数据的 坐标数据进行加法运算。
4.根据权利要求3所述的文字识别方法,其特征在于,
所述预先规定的条件是在所述修正历史表中存在多个包含与所述接收到 的设备标识符和所述接收到的修正后的文字编码为同一设备标识符和文字编 码的记录。
5.一种文字识别系统,包含具有固有标识符,具备数据发送部的输入设 备、文字识别处理服务器、存储了文字识别所必要的表的存储装置、进行修 正历史处理的服务器、和修正终端,其特征在于,所述输入设备将所述输入设备固有的标识符和手写文字数据的坐标位置 的数据对应起来发送给所述文字识别处理服务器;
所述文字识别处理服务器将所述发送的手写文字数据的坐标位置的数据 转换成手写文字图像数据,
并将所述已转换的文字图像数据和所述输入设备固有的标识符以及文字 编码对应起来发送给所述修正终端;
所述修正终端修正与所述发送的文字图像数据对应的文字编码数据,将 所述已修正的文字编码和所述发送的文字图像数据以及所述输入设备固有的 标识符对应起来发送给所述修正历史处理服务器;
所述修正历史处理服务器将所述发送的文字图像数据和已修正的文字编 码以及输入设备固有的标识符对应起来,作为新记录存储到修正历史表;
在所述修正历史表中存在包含与所述发送的文字编码以及输入设备固有 的标识符为相同值的记录时,存在预先规定的数量的该记录时,提取该记录 中包含的文字图像数据;
通过对所述提取出的文字图像数据进行差分检测处理,生成新的文字图 像数据;
把将所述新的文字图像数据和所述修正后的文字编码以及所述设备标识 符对应起来的信息发送给所述文字识别处理服务器;
所述文字识别处理服务器将所述发送的所述新的文字图像数据和所述修 正后的文字编码以及所述设备标识符对应起来的信息存储到附加表中;
为了实施文字识别处理使用所述附加表,其中
所述差分检测处理是分别求出在存储了将预先规定的文字图像数据和文 字编码对应起来的记录的基本表中所包含的文字图像数据的坐标数据和从所 述修正历史表中提取出的多个文字图像数据的坐标数据之间的差分,求出所述已求出的差分的坐标数据的平均值的坐标数据,
对所述已求出的平均值的坐标数据和基本表中所包含的文字图像数据的 坐标数据进行加法运算。
6.一种文字数据的修正历史处理系统,其特征在于,
具有:
接收将设备标识符和文字图像数据以及修正后的文字编码对应起来的信 息的单元;
将所述接收到的信息作为新记录存储到修正历史表的单元;
判断所述修正历史表中包含的各记录是否满足预先规定的条件的单元;
根据所述判断结果,从修正历史表包含的记录中提取多个文字图像数据 的单元:
通过对所述提取出的文字图像数据进行差分检测处理,生成新的文字图 像数据的单元;和
发送把将所述新的文字图像数据和所述修正后的文字编码和所述设备标 识符对应起来的信息的单元,其中
所述差分检测处理是分别求出在存储了将预先规定的文字图像数据和文 字编码对应起来的记录的基本表中所包含的文字图像数据的坐标数据和从所 述修正历史表中提取出的多个文字图像数据的坐标数据之间的差分,求出所述已求出的差分的坐标数据的平均值的坐标数据,
对所述已求出的平均值的坐标数据和基本表中所包含的文字图像数据的 坐标数据进行加法运算。
技术领域\n本发明涉及一种根据由输入设备得到的文字图像数据,识别文字的文字 识别方法、文字数据的修正历史处理方法以及文字识别系统。尤其是涉及提 高文字识别率的文字识别方法、文字数据的修正历史处理方法以及文字识别 系统。\n背景技术\n特开平7-49924号公报中公开了对于笔者的固有特征(所谓的书写习惯), 由于同一个文字的每一次出现、机器识别错误、操笔者反复输入同一个修正, 因此为了消除操笔者负担大的问题,使用补正历史进行文字识别处理。\n在特开平7-49924号公报中记载的发明中,作为手写文字的识别方法, 设置了按照手写文字的笔者不同编辑的补正历史。另外,当操笔者对机器决 定的编码数据进行补正时,将包括该补正的附加信息存储到补正历史中。文 字识别单元在参照文字辞典的同时参照补正历史来决定编码数据。\n特开平7-49924号公报公开了对于作为文字识别结果被补正的文字,通 过根据操笔者的要求,把在识别过程中作为候补的其他文字的编码数据等在 显示装置中进行显示,来减轻操笔者的负担。\n但是,对于某个文字,每个操笔者的手写文字有时具有多个特征,另外, 现在所描述的手写文字的特征和过去注册的补正历史的文字的特征不一定是 一致的。由于这些原因,使用在特开平7-49924号公报中记载的文字识别处 理有时候无法进行文字识别处理。\n发明内容\n本发明提供一种文字识别方法以及文字识别系统,它更忠实地捕捉每个 笔者的手写文字图像的特征,可以进一步得到每个笔者不同的手写文字的特 征。\n本发明提供一种文字数据的修正历史处理方法,包括:接收将设备标识 符和文字图像数据以及修正后的文字编码对应起来的信息;将所述接收到的 信息作为新记录存储到修正历史表;判断所述修正历史表中包含的各记录是 否满足预先规定的条件;根据所述判断结果,从修正历史表包含的记录中提 取多个文字图像数据;通过对所述提取出的文字图像数据进行差分检测处理, 生成新的文字图像数据;发送将所述新的文字图像数据和所述修正后文字编 码以及所述设备标识符对应起来的信息,其中所述差分检测处理是分别求出 在存储了将预先规定的文字图像数据和文字编码对应起来的记录的基本表中 所包含的文字图像数据的坐标数据和从所述修正历史表中提取出的多个文字 图像数据的坐标数据之间的差分,求出所述已求出的差分的坐标数据的平均 值的坐标数据,对所述已求出的平均值的坐标数据和基本表中所包含的文字 图像数据的坐标数据进行加法运算。\n本发明还提供一种文字识别方法,其包括:接收将设备标识符和文字图 像数据以及修正后的文字编码对应起来的信息;将所述接收到的信息作为新 记录存储到修正历史表;判断所述修正历史表中包含的各记录的信息是否满 足预先规定的条件;根据所述判断结果,从修正历史表包含的记录中提取多 个文字图像数据;通过对所述提取出的文字图像数据进行差分检测处理,生 成新的文字图像数据;将所述新的文字图像数据和文字编码以及设备标识符 对应起来的信息存储到附加表;在接收到文字识别处理指示的同时,接收到 将设备标识符和文字图像数据对应起来的信息时,判断在所述附加表中是否 存在与所述文字识别处理指示同时接收到的设备标识符;在所述判断结果为 在所述附加表中存在与所述文字识别处理指示同时接收到的设备标识符时, 根据所述附加表进行文字识别处理;在所述判断结果为在所述附加表中不存 在与所述文字识别处理指示同时接收到的设备标识符时,根据存储了将预先 规定的文字图像数据和文字编码对应起来的记录的基本表,进行文字识别处 理,其中所述差分检测处理是分别求出在存储了将预先规定的文字图像数据 和文字编码对应起来的记录的基本表中所包含的文字图像数据的坐标数据和 从所述修正历史表中提取出的多个文字图像数据的坐标数据之间的差分,求 出所述已求出的差分的坐标数据的平均值的坐标数据,对所述已求出的平均 值的坐标数据和基本表中所包含的文字图像数据的坐标数据进行加法运算。\n本发明提供一种文字识别系统,包含具有固有标识符,具备数据发送部 的输入设备、文字识别处理服务器、存储了文字识别所必要的表的存储装置、 进行修正历史处理的服务器、和修正终端的,该系统包括:所述输入设备将 所述输入设备固有的标识符和手写文字数据的坐标位置的数据对应起来发送 给所述文字识别处理服务器;所述文字识别处理服务器将所述发送的手写文 字数据的坐标位置的数据转换成手写文字图像数据,并将所述已转换的文字 图像数据和所述输入设备固有的标识符以及文字编码对应起来发送给所述修 正终端;所述修正终端修正与所述发送的文字图像数据对应的文字编码数据, 将所述已修正的文字编码和所述接收到的文字图像数据以及所述输入设备固 有的标识符对应起来发送给所述修正历史处理服务器;所述修正历史处理服 务器将所述发送的文字图像数据和已修正的文字编码以及输入设备固有的标 识符对应起来,作为新记录存储到修正历史表;在所述修正历史表中存在包 含与所述发送的文字编码以及输入设备固有的标识符为相同值的记录时,存 在预先规定的数量的该记录时,提取该记录中包含的文字图像数据;通过对 所述提取出的文字图像数据进行差分检测处理,生成新的文字图像数据;把 将所述新的文字图像数据和所述修正后的文字编码以及所述设备标识符对应 起来的信息发送给所述文字识别处理服务器;所述文字识别处理服务器将所 述发送的所述新的文字图像数据和所述修正后的文字编码以及所述设备标识 符对应起来的信息存储到附加表中;为了实施文字识别处理使用所述附加表, 其中所述差分检测处理是分别求出在存储了将预先规定的文字图像数据和文 字编码对应起来的记录的基本表中所包含的文字图像数据的坐标数据和从所 述修正历史表中提取出的多个文字图像数据的坐标数据之间的差分,求出所 述已求出的差分的坐标数据的平均值的坐标数据,对所述已求出的平均值的 坐标数据和基本表中所包含的文字图像数据的坐标数据进行加法运算。\n本发明还提供一种文字数据的修正历史处理系统,其具有:接收将设备 标识符和文字图像数据以及修正后的文字编码对应起来的信息的单元;将所 述接收到的信息作为新记录存储到修正历史表的单元;判断所述修正历史表 中包含的各记录是否满足预先规定的条件的单元;根据所述判断结果,从修 正历史表包含的记录中提取多个文字图像数据的单元;通过对所述提取出的 文字图像数据进行差分检测处理,生成新的文字图像数据的单元;和发送把 将所述新的文字图像数据和所述修正后的文字编码和所述设备标识符对应起 来的信息的单元,其中所述差分检测处理是分别求出在存储了将预先规定的 文字图像数据和文字编码对应起来的记录的基本表中所包含的文字图像数据 的坐标数据和从所述修正历史表中提取出的多个文字图像数据的坐标数据之 间的差分,求出所述已求出的差分的坐标数据的平均值的坐标数据,对所述 已求出的平均值的坐标数据和基本表中所包含的文字图像数据的坐标数据进 行加法运算。\n在本发明中,按照时间序列顺序管理将笔者所使用的手写输入设备的标 识符(设备ID)和手写文字的图像数据以及文字编码对应起来的修正历史数 据。之后,根据修正历史,按照时间序列顺序从新的数据中提取同一个笔者 的同一个文字编码的手写文字图像,进行检测文字图像的特征的处理,通过 以上来提取个人的笔迹的特征。另外,对修正历史数据和基本的文字转换所 必要的文字图像数据进行单独管理,并用于文字识别。\n附图说明\n【图1】对文字识别系统的结构进行说明的方框图。\n【图2】对文字识别的处理顺序进行说明的流程图。\n【图3】对确认·修正终端的工作进行说明的流程图。\n【图4(a)】对存储在修正历史表中的数据进行说明的图。\n【图4(b)】对存储在笔ID设定值表中的数据进行说明的图。\n【图5】对差分检测处理的流程进行说明的图。\n【图6】对差分检测处理进行说明的图。\n【图7】对附加表115进行说明的图。\n【图8】对文字识别处理服务器和确认·修正终端和修正历史处理服务器 之间的通信和处理进行说明的顺序图。\n【图9】对修正历史处理服务器的动作进行说明的图。\n具体实施方式\n图1是对文字识别系统的结构进行说明的方框图。使用图1,对由数码 笔输入的数据的发送接收和计算机的数据识别处理进行说明。\n数码笔101由摄像头102、处理器103、存储器104和通信部105构成。 通信部105由与数据传送用PC106进行有线通信的硬件和软件构成。处理器 103进行在存储器104中存储的数据的发送接收处理和各种数据处理。另外, 数码笔具有能够唯一确定各个数码笔的标识符。\n在用户使用数码笔101在印刷着圆点图案的纸上描绘文字或图形时,数 码笔101通过摄像头102以一定的采样周期采样,将用户手写的文字或图形 的信息转换成数字数据(笔的轨迹(对于纸的手写文字的坐标位置数据)、笔 压、采样的时刻信息),并存储到数码笔101的存储器104中。\n数码笔101通常不与数据传送用PC连接,不连接电线。但是,以与传 送用PC106相连接为契机,在数码笔101的存储器104中存储的位置坐标数 据由数码笔101的通信部105发送,数据传送用PC106进行接收。数据传送 用PC106将位置坐标数据转换成文字数据,经由网络110发送给服务器111。 服务器111根据接收到的文字数据实施文字识别。\n数据传送用PC106具有用于接收来自数码笔101的数据的接口。另外, 省略安装在数据传送用PC106上的各种输入输出设备、存储装置和处理器等 的图示。在数据传送用PC106中使用用于对数码笔101发送的数据进行处理 的设备驱动、操作系统等程序。数据传送用PC106将数码笔101接收到的数 据转换成文字图像数据,存储在数据传送用PC106的存储装置中,并发送给 文字识别处理服务器111。\n服务器111接收由数据传送用PC106处理过的文字数据,通过在服务器 111中使用的文字识别部112进行接收到的文字数据的文字识别处理。\n安装在数码笔101内部的摄像头102以数十赫兹的采样频率识别印刷在 纸上的圆点图案,识别使用数码笔描绘的文字或图形的坐标位置信息(X坐 标、Y坐标)等,由通信部发送其坐标位置数据和数码笔的笔ID。\n另外,数码笔101具有压力传感器,根据压力传感器探测到的内容,可 以作为向数码笔的数据输入或数据的发送等的触发器。例如,当压力传感器 识别到数码笔被压向纸面时,接通数码笔的开关,开始手写数据的输入。反 之,当压力传感器识别到数码笔离开了纸面时,数码笔101的通信部105将 存储在存储器104中的位置坐标数据传送到PC106或文字识别处理服务器 111。在由安装在数码笔内部的存储器传送数据之后,进行断开数码笔开关的 一连的处理。\n在文字识别处理服务器111中,使用作为在进行文字识别的文字识别部 112的内部用于检测文字编码的程序的文字编码检测部113,根据需要进行在 存储装置中存储的基本表114和附加表115中包含的信息的附加、更新或参 照。\n在修正历史处理服务器116中使用对文字数据的修正历史进行管理的程 序,从存储文字的修正历史的修正历史表118中提取必要的数据,进行差分 检测处理。\n下面详细说明文字识别处理服务器111和修正历史处理服务器116的处 理和各表的内容。\n在确认·修正终端108中,使用作为用于接收文字图像数据和手写图像数 据等数据,进行数据处理的程序的文字修正处理部。工作人员使用确认·修正 终端108确认从文字识别处理服务器111发送给确认·修正终端108的数据的 内容,根据需要进行由文字识别处理服务器111发送的文字数据的修正。已 被确认的数据和已被修正的数据等从确认·修正终端108发送给修正历史处理 服务器116。\n使用确认·修正终端108修正后的数据被发送给文字识别处理服务器111 和修正历史处理服务器116。\n在这里,对文字识别处理的概要进行说明。\n数据传送用PC106的ID检测处理部107进行从数码笔101接收到的数 据的识别。ID检测处理部107从接收到的数据中检测数码笔的标识符(数码 笔ID)。另外,ID检测处理部107在从数码笔101接收到的位置坐标数据(根 据描绘在圆点图案上的文字识别的X坐标、Y坐标的数据)中提取文字图像 数据。这些数据被发送给文字识别处理服务器111。在文字识别处理服务器 111的文字识别处理部112中,利用各种表进行文字编码的识别处理。在下面 将使用图2详细地说明该处理。\n与文字识别处理服务器111相连接的存储装置120记录基本表114和附 加表115。在这里,基本表114是把文字图像和文字编码相关联起来的表。基 本表114是基本的文字图像数据,通过所有的数码笔ID通用。\n另一方面,附加表115是把对手写图像数据进行文字识别时失败的文字 修正后的历史与新的图像和文字编码相关联起来的表。附加表115从修正历 史表中提取必要的信息,并将差分检测出的结果的数据和笔ID对应起来管 理。\n与修正历史处理服务器116连接的存储装置121记录修正历史表118。修 正历史表118是存储工作人员使用确认·修正终端108修正后的数据的表。修 正历史处理服务器116的差分检测处理部117从修正历史表118中提取修正 文字的识别所必需的数据,并将进行了差分检测处理的数据存储在附加表115 中。修正历史表118的修正历史数据也是与笔ID对应起来管理。\n此处,对文字识别处理服务器111和修正历史处理服务器116以及确认· 修正终端108中的数据的流动的概要进行说明。\n由数码笔101发送的数据(将手写数据的坐标位置信息和笔ID对应起来 的数据等)经由数据传送用PC106被发送给文字识别处理服务器111。数据 传送用PC106把使坐标位置数据和笔ID对应起来的数据转换成将文字图像 数据和笔ID对应起来的数据,并发送给文字识别处理服务器111。文字识别 处理服务器111将由数据传送用PC106发送的数据(文字图像数据和笔ID) 发送给确认·修正终端108。\n具体地说,(1)多个用户使用各自数码笔进行卡片的填写工作和各种输 入方式的记载。(2)然后,由数码笔将多个手写数据发送给数据传送用PC106。 使用数据传送用PC106进行数据转换处理。进行数据转换处理后的数据被发 送给文字识别处理服务器111。(3)在文字识别处理服务器111中,使用基本 表114和多个数码笔ID的附加表115进行文字识别处理。(4)由文字识别处 理服务器111文字识别的结果的数据被发送给确认·修正终端108。(5)多个 工作人员使用确认·修正终端108进行分担检查在由文字识别处理服务器111 发送的数据中是否存在文字识别处理错误的工作。\n确认·修正终端108的文字修正处理部109将修正后的数据等与笔ID一 起,从确认·修正终端108发送给修正历史处理服务器116。\n修正历史处理服务器116把由确认·修正终端108发送的数据与笔ID一 起存储到修正历史表118中。把在修正历史处理服务器116中处理的结果发 送给文字识别处理服务器111,对于存储到附加表115的处理,使用图3的差 分检测处理进行详细地说明。\n另外,摄像头102根据需要也可以是光传感器(识别光的元件、红外线 检测传感器、识别碳的元件等)。通信部也可以通过蓝牙等的无线通信与数据 传送用PC连接。作为输入设备的一个例子,记述了数码笔,但如果是具有 固有标识符的输入设备,也可以是数码笔以外的其他设备。数据传送用PC106 和文字识别处理服务器111可以是计算机,也可以是用于进行上述处理的专 用机器,还可以是其他的设备。将位置坐标数据转换成文字图像数据的处理 可以通过文字识别处理服务器111来进行。另外,文字识别处理服务器111 和修正历史处理服务器116可以由同一台计算机实现。使用确认·修正终端108 修正后的数据可以发送给文字识别处理服务器111或修正历史处理服务器 116中的一方。\n图2是对文字识别的处理顺序进行说明的流程图。\n在步骤41,以从数据传送用PC106接收到文字图像数据和数码笔ID为 契机,开始文字识别处理。\n在步骤42,文字识别处理服务器111的文字识别部112从接收到的数据 中提取笔ID,进行判别该笔ID的处理。具体地说,判断在附加表中是否存 在笔ID。在附加表115中存在该笔ID时,进入步骤43。在附加表中不存在 ID时进入步骤45。\n在步骤43,文字识别部112使用附加表115实施文字识别,并进入步骤 44。\n在步骤44,文字编码检测部113判断在附加表115中是否存在与文字识 别处理服务器111接收到的文字图像数据对应的文字编码。在文字编码检测 部113判断为在附加表115中存在文字编码时,根据附加表115,将文字图像 数据转换成文本,并进入步骤46。在文字编码检测部113判断为在附加表115 中不存在与该图像数据对应的文字时,进入步骤45。\n在步骤45,根据在附加表115中不存在文字编码的文字编码检测部113 的判断结果,文字识别部112根据基本表114,进入到进行文字图像数据的文 字识别处理的步骤46。\n在步骤46,确认已进行了文字图像数据的识别处理,在存在下一个文字 图像数据时,对下一个文字图像数据反复进行从步骤42的处理,在不存在下 一个文字图像数据时,存储进行了文字识别处理的数据,并结束处理。\n使用图8,对文字识别处理服务器、确认·修正终端和修正历史处理服务 器的处理的流程进行说明。此处,图8是对文字识别处理服务器和确认·修正 终端以及修正历史处理服务器之间的通信和处理进行说明的顺序图。\n在图8中,当文字识别服务器111识别出的数据例如存储在1页左右的 A4纸时,文字识别服务器111在笔ID和文字图像数据中添加自己实施的识 别结果数据,并发送给确认·修正终端108(S91)。接收到文字图像数据和识 别结果数据的确认·修正终端108把它们对应起来在画面中显示。确认·修正终 端108的操作者对比显示的文字图像数据和识别结果数据(S92),对文字识 别结果加以修正(S93)。当所有的确认结束时,确认·修正终端108将笔ID 和文字修正结果数据发送给文字识别服务器111和修正历史处理服务器116 (S94、S95)。\n接收到笔ID和文字修正结果数据的文字识别服务器111更新识别结果数 据(S96)。另外,接收到笔ID和文字修正结果数据的修正历史处理服务器 116更新修正历史表(S97)。此时,随着该更新,需要进行差分检测处理, 因此修正历史处理服务器116实施差分检测处理(S98)。修正历史处理服务 器116将笔ID和差分检测结果数据发送给文字识别服务器111(S99)。接收 到笔ID和差分检测结果数据的文字识别服务器111更新与笔ID对应的附加 数据。\n下面使用图3,对使用确认·修正终端的作业进行说明。在这里,图3是 对使用确认·修正终端的作业进行说明的流程图。确认·修正终端108在等待状 态下(S51),当从文字识别服务器111接收笔ID和文字图像数据以及识别结 果数据时(S52),将文字图像和识别结果数据显示在一个画面上(S53),等 待操作者的操作(S54)。在操作者判断为需要修正时,修正识别结果数据 (S55)。在步骤54,在不需要进行修正以及修正结束的情况下,判断是否还 留有数据(S56),如果还有数据,则回到步骤53,移至下一个画面中的确认。 在步骤56,如果没有数据,则将笔ID和修正后的识别结果数据发送给修正 历史处理服务器116和文字识别服务器111(S57),并返回到步骤51的等待 状态。\n使用图9,说明修正历史处理服务器的动作。在这里,图9是说明修正 历史处理服务器的动作的流程图。修正历史处理服务器116在等待状态下 (S101),当从确认·修正终端108接收文字修正数据时(S102),更新修正历 史表(S103)。然后,修正历史处理服务器116判断文字识别服务器111的附 加表是否需要修正(S104)。当判断为需要进行修正时,修正历史处理服务器 116实施差分检测处理(S105),将差分检测结果数据发送给文字识别服务器 111(S106)。当在步骤104中不需要进行修正或步骤106结束时,修正历史 处理服务器116返回到步骤101的等待状态。\n另外,在图8、图3以及图9的说明中,文字识别处理服务器和确认·修 正终端以及修正历史处理服务器之间的数据是间歇处理的,但是也可以实时 地进行通信。\n使用图4,对与修正历史处理服务器116连接的存储装置121中记录的 修正历史表和实施差分检测处理的修正次数—笔ID设定值表进行说明。在这 里,图4(a)是对存储在修正历史表的数据进行说明的图。另外,图4(b) 是对存储在笔ID设定值表的数据进行说明的图。\n首先,以应识别为原有文字编码“1”,图像1a、1b、1c、1d、1e都由文 字识别处理服务器识别为文字编码“1”以外的文字编码为前提进行说明。在 图4(a)中,列61是文字图像数据和使用确认·修正终端修正后的文字编码 的对应。另外,列62是笔ID。即,图像1a、1c、1e是笔ID(A)的修正, 图像1b、1d是笔ID(B)的修正。列63是计数器,表示笔ID和文字编码以 同一个组合进行了几次修正。\n在图4(b)中,笔ID(A)的设定值为3,笔ID(B)的设定值为5。 在图4(a)中,记录64至记录68是按照时间序列顺序排列的数据。在记录 68中,笔ID(A)的计数值变成图4(b)的笔ID(A)的设定值3,表示推 移到差分检测处理。另外,若结束差分检测处理,则重设计数器。\n差分检测的数据处理由差分检测处理部117执行的。该差分检测处理部 117是在修正历史处理服务器116中使用的程序。\n图4(b)的数据是预先存储在修正历史处理服务器116的存储装置中。 另外,设定值对每个笔ID或每个文字编码,可以将预先规定的修正次数作为 不同的值进行设定。另外,对所有的笔ID可以设定相同的值,也可以以其它 方法设定。在对于每个笔者或在每个业务中使用的数码笔,容易提取特征的 文字图像数据的个数不同的情况下,系统管理者等可以在修正历史处理服务 器116中预先存储所需要的设定值。\n图5是说明差分检测处理的流程的图。\n作为在修正历史处理服务器116中使用的程序的差分检测处理部117从 修正历史表118提取包含满足规定的条件的文字图像数据和转换了该文字图 像数据的文字编码的记录,进行差分检测处理。\n图5的“图像1a”71与在图4的记录64中包含的“图像1a”相对应。 “图像1c”和“图像1e”也相同。这些文字图像数据71~73在修正历史表118 中满足数码笔的ID为“ID(A)”、修正后的文字编码为“文字编码1”、修正 次数为“3次”的条件,因此作为差分检测处理对象的数据是从修正历史表 118中提取出的数据。\n差分检测处理74是对每个笔ID从修正历史中提取进行了固定次数的修 正的数据,根据进行了固定次数的变更的文字图像数据生成新的文字图像数 据“图像1′”的处理。在图6中详细说明根据提取出的文字图像数据生成 新的文字图像数据的处理。\n符号75是将新生成的文字图像数据“图像1′”和用于识别文字图像数 据的文字编码以及笔ID对应起来,生成与笔ID(A)对应的附加表的新记录 用数据的处理。修正历史处理服务器116将用于存储在附加表115中的新记 录的数据发送给文字识别处理服务器111。文字识别处理服务器111接收数 据,并存储到附加表115。在图6中对用于生成上述新的“图像1′”的差分 检测处理74进行说明。\n图6是说明差分检测处理的图。\n与图5的71、72、73对应的文字图像数据为图6的82、83、84。对根 据手写文字图像数据82~84生成作为新的文字图像数据的图5的75“图像1 ′”的处理进行说明。\n在这里,对将手写文字“d”错误地转换成“a(文字编码[25H])”的次 数为3的情况进行说明。手写文字图像“d”必须正确地转换成文字编码(文 字编码[12H])的文本“d”,但因为是具有个性的字体,所以有时错误地转换 成文字编码[25H]的文本“a”。\n提取基本数据和手写文字图像之间的差分,通过使用差分的平均值生成 新的文字图像。在这里,基本数据可以是将各个文字的文字编码和文字的坐 标位置数据对应起来在基本表114中存储的数据,也可以是对每个文字铅印 存储文字的坐标位置信息的数据,也可以是其它数据。\n首先,求出基本文字的坐标位置和手写文字图像的坐标位置的差分 (86~88)。\n([A]-[Bi])=Δai\n[A]:[基本数据的文字的坐标数据]\n[Bi]:[手写数据的文字的坐标数据]\nΔai:笔迹数据的差分的坐标数据\n在本实施例中,以进行了3次手写文字图像的修正为契机,进行差分检 测处理,因此,分别求出3个手写文字图像82~84和基本数据的差分(86~88)。 另外,差分检测处理部117在存储在修正历史表118中的记录中,以时间序 列顺序从新的记录中按顺序,对每个规定的修正次数提取成为差分检测处理 的对象的文字图像。\n另外,在本实施例中,使用印刷了能够识别文字坐标位置(笔的笔画数 据)的圆点图案的纸,检测用数码笔描绘出的文字的坐标位置。从而可以得 到使用数码笔描绘出的轨迹上的坐标位置(X坐标、Y坐标),求出该数码笔 的文字图像数据的坐标位置信息和基本数据的差分。当检测坐标位置时,可 以提取描绘出的图或线或标记的起始点或终点的坐标位置,也可以提取线和 线的交点的坐标位置,也可以检测所有的坐标位置,也可以采用其它方法。\n然后,用图6的公式89求出已求出的差分数据(86~88)的平均值。即, 通过提取修正后的文字图像的特征并求出平均值,来得到手写文字的特征的 数据。对提取出了该特征的文字坐标数据和基本数据的文字图像的文字坐标 数据进行加法运算,生成新的文字图像。在这里,新的文字图像是图5的75 中包含的“图像1′”。\n修正历史处理服务器116将生成的新的文字图像作为用于向附加表118 存储的数据给予笔ID,发送给文字识别处理服务器111。文字识别处理服务 器111将接收到的数据存储到附加表115。\n另外,在图6的例子中,图示了文字图像数据,但在进行他们的差分检 测处理时,并不是仅用文字图像数据计算笔迹数据的差分等,可以将描绘出 的文字图像数据转换成文字的坐标位置数据,用该文字的坐标位置数据来进 行计算,也可以使用其它方法。另外,还可以根据需要使用将文字图像数据 转换成文字的坐标位置数据的程序。\n图7是说明附加表115的图。\n附加表的记录91到93是按照时间序列顺序存储的。各个记录将通过差 分检测处理生成的新的文字图像数据、进行文字转换处理时应该识别的文字 编码、以及数码笔的笔ID对应起来进行存储。\n在记录91中,将文字图像“图像1′”和“文字编码1”以及笔ID“ID (A),,对应起来进行存储。在记录92中,将文字图像“图像1″”和“文 字编码1”以及笔ID“ID(B)”对应起来进行存储。在记录93中,将文字 图像“图像1”和“文字编码1”以及笔ID“ID(A)”对应起来进行 存储。\n记录91和92即使是不同的文字图像,也转换成与每个笔ID对应起来的 文字编码。作为结果,在该例子中无论哪一个,作为文字编码1进行文字识 别,作为文本文字进行变换处理。\n记录91和93是包含相同的笔ID和相同的文字编码的记录。记录93是 比记录91更新的记录。在本实施例中,对于某个文字编码,将多个文字图像 对应起来存储。即,按照时间序列顺序提取文字的特征并进行保管。\n95的箭头表示进行检查的方法。例如,在对给予了笔ID[ID(A)]的文 字图像数据进行文字识别时,按照附加表115的新的记录顺序检查附加表, 检索成为转换对象的文字图像。\n在附加表115中存储多个将文字图像数据和文字编码以及笔ID对应起来 的记录。在本实施例中,表示对于所有的笔ID的数据按照时间序列顺序(96) 进行存储的例子。另外,各表的记录可以通过给予时刻数据来管理。数码笔 的管理者通过按照时间序列顺序存储数据,与在某个时刻变更数码笔的使用 者相对应,能够消除存储在表中的数据或可以作为在固定期间内使用过的过 去的文字数据给予使用者名,作为其他的文件进行存储。\n另外,对于所有的笔ID,不是在一个附加表中将文字数据和文字编码对 应起来管理,而是可以对每一个笔ID设置附加表115,也可以用其它方法。\n另外,附加表115可以存储在能够从文字识别处理服务器111进行存取 的记录介质或存储装置中,因此并不限定于图1所示的例子。例如,可以在 数码笔101的存储装置或数据传送用PC106的存储装置中存储附加表。\n是进行本实施例的文字数据的修正历史处理的程序,接收将设备标识符 和文字图像数据以及修正后的文字编码对应起来的信息,将所述接收到的信 息作为新记录存储到修正历史表中,判断所述修正历史表中包含的各记录是 否满足预先规定的条件,根据所述判断结果,从修正历史表中包含的记录中 提取多个文字图像数据,通过对所述提取出的文字图像数据进行差分检测处 理,来生成新的文字图像数据,把将所述新的文字图像数据和所述修正后的 文字编码以及所述设备标识符对应起来的信息发送给其他程序。\n另外,本实施例的文字识别系统包括:具有固有标识符具备数据发送部 的输入设备、文字识别处理服务器、存储文字识别所需要的表的存储装置、 进行修正历史处理的服务器、和修正终端,在该文字识别系统中,所述输入 设备将所述输入设备固有的标识符和手写文字数据的坐标位置的数据对应起 来发送给所述文字识别处理服务器。\n所述文字识别处理服务器将所述发送的手写文字数据的坐标位置的数据 转换成手写文字图像数据,将所述转换后的文字图像数据和所述输入设备固 有的标识符以及文字编码对应起来发送给所述修正终端。\n所述修正终端修正与所述发送的文字图像数据对应的文字编码数据,将 所述修正后的文字编码和所述接收到的文字图像数据以及所述输入设备固有 的标识符对应起来发送给所述修正历史处理服务器。\n所述修正历史处理服务器将所述发送的文字图像数据和修正后的文字编 码以及输入设备固有的标识符对应起来,作为新记录存储到修正历史表中, 当在所述修正历史表中存在包含与所述发送的文字编码以及输入设备固有的 标识符为同一值的记录时,在存在预先规定的个数的该记录的情况下,提取 在该记录中包含的文字图像数据,通过对所述提取出的文字图像数据进行差 分检测处理,来生成新的文字图像数据,把将所述新的文字图像数据和所述 修正后的文字编码以及所述设备标识符对应起来的信息发送给所述文字识别 处理服务器。\n所述文字识别处理服务器把将所述发送的所述新的文字图像数据和所述 修正后的文字编码以及所述设备标识符对应起来的信息存储到附加表中,在 所述附加表进行文字识别处理。\n这样,根据本实施例,根据使用数码笔描绘的轨迹的坐标位置提取文字 的特征,因此即使是文字的书写顺序有错误的情况,也可以根据描绘的位置 信息识别文字,提取特征。\n另外,根据本实施例,按时间序列顺序把对所有的文字图像进行了修正 的信息存储到修正历史表118中,从新的修正数据中按照顺序提取文字图像 的特征,通过附加并更新附加表115,不仅是过去注册的文字的特征,还可 以识别现在的文字的特征。\n即,在本实施例中,根据特定的条件(例如,每个修正次数、修正文字 编码等条件),反复进行从修正历史的信息中,对于与特定的设备ID相对应 的修正历史,按照时间序列顺序从新的修正数据中提取特征的处理。因此, 在附加表中根据条件附加存储提取出特征的数据。这样,因为使用根据条件 积聚了文字的特征的附加表进行文字识别,所以能够进行更细致的文字识别。\n根据本实施例,不更新基本表,设置附加表,通过实施与设备ID对应的 优先的文字识别,作为结果,能够提高文字识别率。\n反之,也能够防止由于基本表的更新引起的文字识别表的修改错误。\n根据本实施例,能够捕捉每个设备ID的笔迹的特征。另外,单独管理提 取出笔迹特征的数据和用于进行文字识别处理的基本信息的数据,通过将各 自的数据与设备ID对应起来使用,提高文字识别率。
法律信息
- 2013-09-04
未缴年费专利权终止
IPC(主分类): G06K 9/68
专利号: ZL 200510084206.8
申请日: 2005.07.15
授权公告日: 2008.02.20
- 2008-02-20
- 2006-03-08
- 2006-01-18
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2003-03-05
|
2002-07-31
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |