著录项信息
专利名称 | 检索设备和检索方法 |
申请号 | CN200680027651.3 | 申请日期 | 2006-07-24 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2008-07-30 | 公开/公告号 | CN101233511 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0;;;G;0;3;G;2;1;/;0;0查看分类表>
|
申请人 | 佳能株式会社 | 申请人地址 | 日本东京
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 佳能株式会社 | 当前权利人 | 佳能株式会社 |
发明人 | 户高伸治 |
代理机构 | 中国国际贸易促进委员会专利商标事务所 | 代理人 | 杜娟 |
摘要
本发明的目的在于使用户能够容易而简单地指定或输入用作文档检索键的图像。即,检索设备读取文档图像(S7001)以获得图像数据,在图像数据中提取图像区域(S7004),以及在显示装置上显示与所提取的图像区域对应的图像的列表(S7008)。当用户经由输入装置选择列表中显示的至少一个图像时(S7009),使用所选择的图像作为检索键来执行检索(S7010)。
1.一种用于执行与检索键对应的数据检索的检索设备,其特征在于包括:
读取装置,用于读取文档图像以获得图像数据;
模式选择装置,用于从用户接收指令,所述指令用于选择使用图像作为检索键执行检索的图像检索模式和使用关键词作为检索键执行检索的关键词检索模式中的一种模式;
图像区域提取装置,用于在用户选择图像检索模式的情况下提取在所述图像数据中的多个图像区域;
关键词提取装置,用于在用户选择关键词检索模式的情况下提取在所述图像数据中的多个关键词;
列表显示装置,用于在用户选择图像检索模式的情况下显示与由所述图像区域提取装置提取的图像区域对应的多个图像的列表,以及在用户选择关键词检索模式的情况下显示由所述关键词提取装置提取的多个关键词的列表;以及
输入装置,用于在用户选择图像检索模式的情况下输入用于从所述多个图像的列表选择图像的指令,以及在用户选择关键词检索模式的情况下输入用于从所述多个关键词的列表选择关键词的指令;
其中在用户选择图像检索模式的情况下使用所选择的图像作为所述检索键,以及在用户选择关键词检索模式的情况下使用所选择的关键词作为所述检索键。
2.如权利要求1所述的检索设备,其特征在于还包括:
缩小装置,用于缩小与由所述图像区域提取装置所提取的图像区域对应的图像的尺寸,
其中所述列表显示装置显示与由所述图像区域提取装置提取的图像区域对应的缩小图像的列表。
3.如权利要求1所述的检索设备,其特征在于,
使用所选择的图像的特征信息作为所述检索键来执行检索。
4.如权利要求3所述的检索设备,其特征在于,
所述特征信息包含图像的边沿信息、颜色信息、和布局式样中的至少一个。
5.如权利要求1所述的检索设备,其特征在于
所述列表显示装置具有显示屏,所述输入装置包括提供在所述显示屏上的触摸板。
6.如权利要求1所述的检索设备,其特征在于,
所述检索设备是至少具有读取功能和打印功能的多功能外设。
7.一种用于执行与检索键对应的数据检索的检索方法,其特征在于包括以下步骤:
读取步骤,读取文档图像以获得图像数据;
模式选择步骤,从用户接收指令,所述指令用于选择使用图像作为检索键执行检索的图像检索模式和使用关键词作为检索键执行检索的关键词检索模式中的一种模式;
图像区域提取步骤,在用户选择图像检索模式的情况下提取在所述图像数据中的多个图像区域;
关键词提取步骤,在用户选择关键词检索模式的情况下提取在所述图像数据中的多个关键词;
显示步骤,在用户选择图像检索模式的情况下在用于显示信息的显示装置上显示与在所述图像区域提取步骤中提取的图像区域对应的图像的列表,以及在用户选择关键词检索模式的情况下在显示装置上显示在所述关键词提取步骤中提取的关键词的列表;以及输入步骤,在用户选择图像检索模式的情况下输入用于从所述图像的列表选择图像的指令,以及在用户选择关键词检索模式的情况下输入用于从所述关键词的列表选择关键词的指令,
其中,在用户选择图像检索模式的情况下使用所选择的图像作为检索键,以及在用户选择关键词检索模式的情况下使用所选择的关键词作为所述检索键。
检索设备和检索方法 \n技术领域\n[0001] 本发明涉及一种检索设备和检索方法。更具体地说,本发明涉及在使用具有存储由例如扫描仪读取的文档数据信息的功能的检索设备从所存储的文档数据当中检索目标文档数据的情况下,使用在文档数据中包含的图像数据作为检索键(search key)来检索目标文档数据的技术。 \n背景技术\n[0002] 在最近的办公室环境中,随着工作变得复杂和信息量的增加,要管理的文档数据的量很大地增加。因此,甚至更为需要从大量的文档中检索目标文档。通过把多条文档信息转换成电子数据并作为文档数据来存储,文档检索设备或文档检索系统能够在检索目标文档时使用这个转换的信息。 \n[0003] 已经提出了各种文档检索方法,包括:文档属性检索,其检索与文档数据相关的信息(即,属性数据);全文检索,其检索在文档数据中包含的字符串;以及图像数据检索,其检索在文档数据中包含的图像数据。 \n[0004] 为了执行这些检索方法,需要向检索设备(检索引擎)输入检索键。与诸如属性检索或全文检索之类的使用字符串作为键的检索方法不同,使用图像数据作为键的图像检索的问题是如何使用户能够容易地并简单地指定或输入这种图像检索键。 [0005] 例如在专利参考文献1中所述的图像存储设备利用扫描仪扫描具有预先指定区域的文档来获得检索键。此外,在专利文献2中所述的图像存储设备通过如下方式来提取检索键:在窗口上显示利用扫描仪进行扫描而获得的文档数据,并利用例如鼠标指定要用作检索键的区 域。此外,在专利参考文献3中所述的一种类似图像检索设备预先登记要用作检索键的的图像数据,并在登记的图像数据当中指定检索键。 \n[0006] 专利参考文献1:日本专利特开5-274367号 \n[0007] 专利参考文献2:日本专利特开5-274368号 \n[0008] 专利参考文献3:日本专利特开10-340272号 \n发明内容\n[0009] 本发明要解决的问题 \n[0010] 然而,在专利参考文献1中所述的图像存储设备中,为了指定要登记为检索键的区域,需要在原始文档中写入区域信息。此操作对于用户是麻烦的。此外,为了保持原始文档清洁,文档必须被复印。 \n[0011] 在专利参考文献2中,为了使用户能够指定作为键的区域,需要诸如笔设备或鼠标之类的操作装置来指定所述区域。诸如具有扫描仪仪功能、复印功能、以及打印机功能的多功能外围设备之类的OA装置通常没有这种操作装置。因而,必须新增加除了图像检索之外不使用的操作装置,并且该操作装置的附加位置或容纳方法产生新问题。此外,为了从足够大的显示区域提取多个检索键,用户必须进行多次麻烦的区域指定。 \n[0012] 在专利参考文献3所述的类似图像检索设备中,用户难于自由地选择要被记录为检索键的图像数据,因而,可能降低检索精度。 \n[0013] 本发明是考虑上述情况而作出的,其目的在于,使用户能够容易而简单地指定或输入作为检索键的图像数据。 \n[0014] 本发明的另一个目的在于,即使在文档数据的被限制的显示区域内,也使用户能够容易地指定或输入作为检索键的图像数据。 \n[0015] 用于解决问题的手段 \n[0016] 为实现上述目的,按照本发明的一个方面,提供一种用于根据预定检索键从多个存储的数据中检索所需数据的检索设备,其包括: \n[0017] 读取装置,用于读取文档图像以获得图像数据; \n[0018] 区域提取装置,用于提取在所述图像数据中的图像区域; \n[0019] 显示装置,用于显示信息; \n[0020] 输入装置,用于输入指令;以及 \n[0021] 列表显示装置,用于在所述显示装置上显示与由所述区域提取装置提取的图像区域对应的多个图像的列表; \n[0022] 其中当所述输入装置选择在所述列表中显示的所述多个图像中的至少一个时,使用所选择的图像作为检索键来执行检索。 \n[0023] 为了实现上述目的,按照本发明的另一个方面,提供一种用于根据预定检索键从多个存储的数据中检索所需数据的检索方法,包括以下步骤: \n[0024] 读取文档图像以获得图像数据; \n[0025] 提取在所述图像数据中的图像区域; \n[0026] 在用于显示信息的显示装置上显示与在所述区域提取步骤中提取的图像区域对应的图像的列表;以及 \n[0027] 当用于输入指令的输入装置选择在所述列表中显示的所述图像中的至少一个时,使用所选择的图像作为检索键来执行检索。 \n[0028] 即,在本发明中,用于根据预定检索键从存储的数据中检索数据的检索设备在通过读取文档图像而获得的图像数据中提取图像区域,在用于向用户显示信息的显示装置上显示与所提取的图像区域对应的图像的列表,当用户利用用于使用户输入指令的输入装置选择列表中显示的图像中的至少一个时,使用所选择的图像作为关键字来执行检索。 [0029] 这种配置提取文档中的图像,显示所提取的图像的列表,并使用由用户选择的图像作为检索键来执行检索。 \n[0030] 因而,用户可以容易而简单地指定或输入作为检索键的图像,增加了用户的便利性。 \n[0031] 发明效果 \n[0032] 按照本发明,检索设备提取文档中的图像作为图像数据,显示图 像数据的列表,并利用由用户从列表中显示的图像数据中选择的图像数据作为检索键来执行检索。 [0033] 因而,用户可以容易而简单地指定或输入作为检索键的图像数据,增加了用户的便利性。 \n[0034] 从下面的示例性实施例(参照附图)的描述可以清楚地看出本发明的其它特征。 附图说明\n[0035] 包括在说明书中并构成说明书的一部分的附图与说明书一起用于例示本发明的实施例,用于解释本发明的原理。 \n[0036] 图1是用于解释按照本发明的实施例的文档检索设备的总体布置的方块图; [0037] 图2是用于解释图1所示的文档检索设备的主单元的硬件配置的方块图; [0038] 图3是表示按照本发明的文档检索设备的外观的视图; \n[0039] 图4是表示按照本发明的文档检索设备的主单元的软件配置的方块图; [0040] 图5是表示按照本发明的文档管理设备的软件配置的方块图; \n[0041] 图6是表示在按照本发明的文档管理设备的检索处理中在操作单元上显示的窗口的转换示例的示意图; \n[0042] 图7是表示在选择“图像检索”之后直到执行检索之前的、由按照本发明的文档管理设备的主单元执行的处理的流程图;以及 \n[0043] 图8是表示在选择“经由OCR的关键字检索”直到执行检索之前的、由按照本发明的文档管理设备的主单元执行的处理的流程图。 \n具体实施方式\n[0044] 下面将参照附图详细说明本发明的优选实施例。注意,在下面实施例中的每个元件并不旨在限制本发明的范围,而仅仅作为示例。 \n[0045] 图1是用于解释按照本发明的实施例的文档检索设备的总体布置 的方块图。 [0046] 本实施例的文档检索设备1000包括:作为图像输入装置的扫描仪1002;作为图像输出装置的打印机1003;和作为用户接口单元的操作单元1004。设备1000还包括用于控制上述部分的主单元1001,以及具有用于存储、管理和检索文档数据的功能的文档管理系统1005。扫描仪1002、打印机1003和操作单元1004中的每一个通过相应接口经由内部总线(未示出)连接到主单元1001。 \n[0047] 主单元1001连接到诸如LAN 1010之类的网络传输装置和公共交换电话网1020。\n文档管理系统1005也连接到LAN1010,以便经由LAN1010与主单元1001传递数据和命令。\n代替在文档检索设备1000中提供文档管理系统1005,具有与文档管理系统1005相同功能的外部服务器可通过LAN 1010连接到文档检索设备1000的外部。 \n[0048] 本实施例的文档检索设备1000被配置为可由用户识别为一个设备。文档检索设备1000被设计为多功能外设(MFP),其不仅具有文档检索功能,而且具有复印功能、传真功能、打印机功能和文档存储功能。 \n[0049] 图2是用于解释图1所示的文档检索设备的主单元1001的硬件配置的方块图。\n图1中的标号1001对应于图2中的2000,1002对应于2070,1003对应于2080,1004对应于2050,1005对应于2060,1010对应于2020,1020对应于2010。 \n[0050] 参见图2,主单元2000是控制器,用于输入和/或输出文档数据、图像信息和装置信息。主单元2000通过与其相连的作为图像输入装置的扫描仪2070和作为图像输出装置的打印机2080实现扫描仪和打印机功能。主单元2000还通过LAN 2020与诸如文档管理系统2060或PC(未示出)之类的外部装置进行通信,从而实现存储、读取和检索文档的功能。主单元2000还连接到公共交换电话网(PSTN)2010,以实现传真功能。作为用户接口(UI)以对用户提供这些功能的操作单元2050连接到主单元2000。 \n[0051] CPU 2001是用于控制整个主单元2000的控制器。RAM 2002是 用于操作CPU 2001的系统工作存储器。RAM 2002还用作用于暂时存储图像数据的图像存储器。ROM 2003是用于存储系统的引导程序的引导ROM。HDD 2004是硬盘驱动器,用于存储系统软件、图像数据、与图像数据相关的属性数据、以及其它用户数据。通过例如执行在HDD 2004中存储的系统软件来实现用于文档检索的操作规程(后面说明)。 \n[0052] 操作单元I/F 2006用作操作单元2050的接口单元,并向操作单元2050输出要在操作单元2050的显示装置6000上显示的图像数据。操作单元I/F 2006还向CPU 2001传送由用户通过操作单元2050输入的信息。 \n[0053] 网络2007连接到LAN 2020,以便从/向连接到LAN 2020的诸如文档管理系统\n2060或PC之类的外部装置输入/输出信息。文档检索设备1000支持作为网络通信协议的TCP/IP。文档管理系统2060也按照TCP/IP通信协议进行通信。 \n[0054] MODEM 2008连接到公共交换电话网(PSTN)2010,以便利用传真功能把图像数据传递到设置在公共交换电话网2010上的传真设备(未示出)。上述这些装置被连接到系统总线2009。 \n[0055] 图像总线I/F 2005用作连接到系统总线2009和图像总线2030的总线桥,用于高速传输图像数据并转换数据结构。图像总线2030配置有PCI总线或IEEE1394总线。 [0056] 以下装置被布置在图像总线2030上。光栅图像处理器(RIP)2031把从例如连接到LAN 2020的PC输入的PDL代码光栅化为位图图像。装置I/F 2032把作为图像输入/输出装置的扫描仪2070和打印机2080连接到主单元控制器2000,并转换图像数据的同步/异步系统。 \n[0057] 扫描仪图像处理单元2033校正、操纵和编辑来自扫描仪2070的图像数据。扫描仪图像处理单元2033具有根据图像数据的颜色信号分量确定输入的图像数据是彩色图像还是单色图像并保持该确定结果的功能。 \n[0058] 打印机图像处理单元2034校正、操纵和编辑由打印机2080输出 的图像数据。图像旋转单元2035与扫描仪图像处理单元2033协同操作,在读取的同时旋转由扫描仪2070读取的图像数据,并把该图像数据存储在RAM 2002中。图像旋转单元2035还旋转在RAM \n2002中的图像数据。图像旋转单元2035还使得可以与打印机图像处理单元2034协同操作,在旋转图像数据的同时打印在HDD 2004或RAM 2002中的图像数据。 \n[0059] 分辨率转换单元2037转换RAM 2002中的图像数据的分辨率,并把图像数据再次存储在RAM 2002中。颜色空间转换单元2038通过矩阵运算把例如RAM 2002中的YUV图像数据转换成Lab图像数据,并把图像数据再次存储在RAM 2002中。色调转换单元2039通过诸如误差扩散处理之类的技术把例如RAM 2002中的9位256色调的图像数据转换成\n1位2色调的图像数据,并把图像数据再次存储在RAM 2002中。图像压缩/解压单元2036按照诸如JPEG之类的格式压缩/解压多级图像数据,并按照诸如JBIG、MMR、MR、或MH之类的格式压缩/解压二进制图像数据。 \n[0060] 图像旋转单元2035、分辨率转换单元2037、颜色空间转换单元2038、色调转换单元2039以及图像压缩/解压单元2036可被连接在一起。例如,在RAM 2002中的图像数据的旋转处理和分辨率转换处理可同时进行,而不把数据暂时存储在RAM 2002中。 [0061] 图3是表示按照本实施例的文档检索设备1000的外观的透视图。如参照图1所述,本实施例的文档检索设备1000是作为多功能外设提供给用户的,其具有复印功能、传真功能、打印机功能、和文档管理功能。 \n[0062] 作为图像输入装置的扫描仪单元3001对在诸如纸之类的印刷介质上的文档进行照射,并扫描CCD线传感器(1ine sensor),由此把文档转换成光栅图像数据,即电信号。也就是说,用户把文档纸张放在文档馈送器3002的盘上,并经由操作单元3006指示开始读取文档。然后,图2所示的主单元控制器CPU 2001向扫描仪2070发送命令。文档馈送器\n3002逐页运送文档纸张,并开始文档读取操作。 \n[0063] 作为图像输出装置的打印机单元3003输出光栅图像数据作为在纸上的打印图像,任何打印系统都是可以利用的。例如,可以使用利用感光鼓或感光带的电子照相型打印系统,或者使用从小喷嘴阵列喷射油墨并直接在纸张上打印图像数据的喷墨型打印系统。 [0064] 响应来自作为控制器的CPU 2001的指令,开始打印操作。打印机单元3003具有多个馈送台3004,用于选择不同的纸尺寸和纸取向。在馈送台3004中设置有相应的纸盒。\n此外,排放盘3005接收打印的纸张。也可以按照来自作为控制器的CPU 2001的命令进行诸如分类和装订的后处理。 \n[0065] 图1所示的主单元1001和文档管理系统1005被布置在文档检索设备1000内,因此从外部看不到。 \n[0066] 图4是表示按照本实施例的文档检索设备1000的主单元1001的软件配置的方块图。图4所示的软件被存储在图2所示的HDD 2004中。 \n[0067] 用于控制操作单元2050的UI控制管理器4001进行控制以向下层模块发送用户指令,或在操作单元2050的显示装置6000上显示来自下层的信息。网络控制管理器4002进行控制以通过网络接收指令或信息,或发送来自主单元1001的指令或信息。 [0068] 复印应用单元4003和发送应用单元4004接收来自UI控制管理器4001的指令,并使每个管理器单元(后面说明)执行复印作业和传送作业。 \n[0069] 文档管理应用单元4005与文档管理系统1005通信,并提供文档管理功能。文档管理应用单元4005控制检索处理(下面说明)。文档管理应用单元4005连接到从文档数据中包含的图像数据中提取文本信息的OCR引擎4006,还连接到从文档数据中包含的图像数据中提取所需区域内的图像数据的块选择(BS)引擎4007。 \n[0070] 本实施例的BS引擎4007识别图像数据中的图像区域和文本区域,并产生图像数据中的每个区域的类型、位置和尺寸的信息。BS引擎4007还可以确定与图像区域和文本区域不同的各种属性块(如表 块、艺术线条块、背景块等),并提取每种属性的块(区域)。 [0071] 公共接口单元4008吸收下层的每个管理单元的装置相关部分。作业管理器4009排列从公共接口单元4008接收的多条作业信息,并将其发送给与下层的装置紧密相关的多个管理器(4010到4014)。例如,如果接收的作业指示“本地复印”,则作业管理器4009控制扫描管理器4011和打印管理器4010。 \n[0072] 如果接收的作业是传真传送作业,则作业管理器4009控制扫描管理器4011、用于文档存储的文件管理器4014以及传真管理器4012。如果接收的作业是LIPS或PostScript的PDL打印作业,则作业管理器4009控制PDL管理器4013、文件管理器4014和打印管理器\n4010。通过这种方式,作业管理器4009按照接收的作业控制每个管理器的诸如启动、同步和终止的处理。 \n[0073] 图5是表示在按照图1所示的本实施例的文档检索设备1000中布置的文档管理系统1005的软件配置的方块图。文档管理系统1005对主单元1001提供文档的存储、获取和检索的功能。图5中的标号5004和5005表示与图4中的4006以及4007相同的部分。 [0074] 网络控制单元5001控制与主单元2000的网络控制管理器4002的通信。检索控制单元5002执行对于从主单元2000请求的检索的处理,或者创建所存储的文档数据的检索索引的处理。 \n[0075] 图像文档处理单元5003根据需要进行缩略图图像数据的创建或图像的转换。图像文档处理单元5003还按照所记录的文档数据从所记录的文档数据中提取检索索引。即,由图像文档处理单元5003把要记录在文档管理系统1005中的文档数据转换成预定格式。\n对于图像数据,块选择(BS)引擎5005提取在文档数据中包含的图像区域。对于文本(字符)数据,OCR引擎5004从文档数据中包含的图像数据中提取索引数据和固定字符信息。 [0076] 文档管理控制单元5006分配关于文档管理的所有处理。标号5007表示在文档管理系统侧上使用的暂时数据的存储位置。 \n[0077] 数据库控制单元5008进行要存储在数据库中的各种数据的创建, 并存储与卷数据库5009、属性数据库5010、全文检索数据库501 1和图像检索数据库5012对应的各种数据。数据库控制单元5008还按照来自主单元1001的请求,从每个数据库中读出数据并创建要传输到主单元1001的文档数据。 \n[0078] 卷数据库5009存储文档数据实体。卷数据库5009是概念性单元,其实体可以是文档管理系统1005的OS上的文件系统。属性数据库5010存储关于诸如文档数据的名称、创建日期和注释之类的属性的信息。全文检索数据库5011记录由OCR引擎5004从所记录的文档数据中提取的索引数据和固定字符信息。当主单元1001指示全文检索时,对全文数据库5011进行全文检索。图像检索数据库5012以与文档数据相关联的方式记录由块选择(BS)引擎5005从所记录的文档数据中提取的图像区域的特征。当主单元1001指示进行图像检索时,对图像检索数据库5012进行图像检索,以按照检索目标图像数据的特征找出相关联的文档数据。 \n[0079] 图6是表示在按照本实施例的检索处理中在操作单元2050内提供的显示装置\n6000上显示的显示窗口的转换示例的视图。将参照图6说明按照本实施例的检索处理的过程。 \n[0080] 首先显示基本显示窗口6001。本实施例的操作单元2050使用显示装置6000的触摸板。当用户按下在显示窗口上显示的按钮时,执行对应的功能。在本示例中,显示对应于包括“复印”、“传送”和“检索”等10个功能的多个按钮。对于检索,在本示例中显示对应于两个功能即“利用标准的检索”和“原件检索”的按钮6050和6060。“利用标准的检索”表示检索含有被指定为检索键的图像或关键字的文档数据。在另一方面,“原件检索”表示检索与文档页的读取图像完全一致的文档数据(当读取具有多页的文档时,检索与所有文档页的图像一致的文档数据)。 \n[0081] 在按下基本显示窗口6001上的“利用标准的检索”按钮6050之后,显示显示窗口\n6002。在这个显示窗口中,用户能够通过按钮6070或6080选择“图像检索”或“经由OCR进行关键字检索”。 \n[0082] 如果用户在显示窗口6002内选择“图像检索”,则显示显示窗口6013以设置文档输入等待状态,以便提取要用作检索键的图像数据。 \n[0083] 当显示显示窗口6013并且用户放置文档并按下“扫描开始”按钮时,该文档被读取,BS引擎从读取的图像数据中提取图像区域。所提取的图像区域作为缩略图图像被显示在显示窗口6014上。在这个示例中,显示3个缩略图图像。用户在显示窗口6014上选择要用作检索键的图像数据,并按下“检索开始”按钮以执行检索。为了选择缩略图图像,用户只需要触摸缩略图图像的区域。例如在缩略图图像的左上方提供的复选框中显示的标记表示该图像正被选择。在本实施例中,用户能够选择多个图像数据作为检索键。在这种情况下,用户能够选择是通过多个图像数据的AND还是多个图像数据的OR进行检索。 [0084] 当用户按下“检索开始”按钮时,主单元1001对文档管理系统1005发出“图像检索”的指令。文档管理系统1005执行检索,并把结果返回主单元1001。在接收到检索结果后,主单元1001在显示窗口6015上显示该结果。显示窗口6015显示诸如文档名、一致率(相似度)、更新日期和存储位置之类的信息的列表。用户能够在显示窗口6015上选择所需的文档数据,并执行诸如打印或传送之类的操作。 \n[0085] 在另一方面,当用户在显示窗口6002上选择“经由OCR的关键字检索”时,显示显示窗口6023,并且系统1005变成等待状态,等待输入要提取关键字的文档。 [0086] 当显示窗口6013被显示,并且用户放置文档并按下“扫描开始”按钮时,该文档被读取,OCR引擎从所读取的图像数据中提取关键字。这样提取的关键字被列举在显示窗口\n6024上。用户在显示窗口6024上选择要用作检索键的关键字,并按下“检索开始”按钮以执行检索。为了选择关键字,用户只需要触摸关键字的区域。如在关键字的左上方提供的复选框中显示的标记表示该关键字正被选择。在本实施例中,用户能够选择多个关键字作为检索键。在这种情况下,用户能够选择是利用多个关键字的AND还是多个关键字的OR进行检索。 \n[0087] 当用户按下“检索开始”按钮时,主单元1001对文档管理系统 1005发出“经由OCR的关键字检索”指令。文档管理系统1005执行检索,并把结果返回给主单元1001。在接收到检索结果后,主单元1001便在显示窗口6025上显示该检索结果。显示窗口6025显示诸如文档名、一致率(相似度)、更新日期和存储位置之类的信息的列表。用户能够在显示窗口6015上选择所需的文档数据,并执行诸如打印或传送之类的操作。 \n[0088] 图7是按照本实施例在选择“图像检索”之后直到执行检索之前、由文档检索设备\n1000的主单元执行的处理的流程图。这个处理对应于当显示如图6所示的显示窗口6013和6014时执行的处理。 \n[0089] 当用户选择“图像检索”,放置文档以提取作为检索键的图像,并指示开始读取时,主单元2000启动扫描仪2070以执行文档读取处理(步骤S7001)。读取的图像数据被暂时存储在HDD 2004中。 \n[0090] 主单元对于所存储的图像数据执行块选择(BS)(步骤S7002)。BS引擎4007按照来自文档管理应用4005的指令执行这个处理。作为块选择的结果,确定是否存在图像区域(步骤S7003)。如果不存在图像区域,则结束处理。然而,如果存在图像区域,则从所存储的图像数据中提取对应的图像区域,并将该图像区域存储在RAM 2002中(步骤S7004)。 [0091] 接着,从提取的图像区域中提取图像特征(步骤S7005)。这个处理提取图像的边沿信息、颜色信息和布局式样作为图像特征,并把它们作为文件存储在HDD 2004中。在这个实施例中,在HDD 2004中存储的文件名包括预定的名称和名称后面的序列号,例如AREA01.xml和AREA02.xml。主单元2000向文档管理系统2060发出含有作为检索键的图像特征的信息的“图像检索”指令。因而,与传输图像数据本身作为检索键的情况相比,可以减少传输数据的量。文档管理应用单元4005执行图像特征提取处理。 \n[0092] 创建所提取的图像数据的缩小(缩略图)图像,并将其存储在HDD2004中(步骤S7006)。即使在这种情况下,所存储的图像的名称也包括预定的名称和其后的序列号,例如AREA01.jpg和AREA02.jpg。 因为在本实施例中对于每个图像区域执行这个处理,从而能够使得在步骤S7005创建的图像特征信息与缩略图图像相关联。 \n[0093] 确定是否存在下一个图像区域(步骤S7007)。如果存在下一个图像区域,则处理返回步骤S7004,以重复该处理。如果不存在下一个图像区域,则确定是否完成所有图像区域的处理。在显示窗口6014上显示在步骤S7006存储的缩略图图像的列表(步骤S7008)。 [0094] 当用户选择要用作检索键的图像数据并指示开始检索(步骤S7009)时,主单元\n2000向文档管理系统2060发出含有与作为检索键的所选图像数据相对应的图像特征信息在内的“图像检索”指令(步骤S7010)。然后结束处理。 \n[0095] 图8是示出按照本实施例在选择“经由OCR的关键字检索”之后直到执行检索之前、文档检索设备1000的主单元执行的处理的流程图。这个处理对应于当显示如图6所示的显示窗口6023和6024时执行的处理。 \n[0096] 当用户选择“经由OCR的关键字检索”,放置文档以提取关键字,并指示开始读取时,主单元2000启动扫描仪2070以执行文档读取处理(步骤S8001)。所读取的图像数据被暂时存储在HDD 2004中。 \n[0097] 对于所存储的图像数据执行块选择(BS)(步骤S8002)。BS引擎4007按照来自文档管理应用4005的指令执行这个处理。作为块选择的结果,确定是否存在文本区域(步骤S8003)。如果不存在文本区域,则结束处理。如果存在文本区域,则从存储的图像数据中提取对应的文本区域,并将该文本区域存储在RAM 2002中(步骤S8004)。 \n[0098] 主单元通过OCR从所提取的文本区域中提取字符串(步骤S8005)。OCR引擎4006执行这个处理。对所提取的字符串进行语素分析处理以提取名词。所提取的名词根据出现的频率或位置,按照优先权顺序被排列,并作为关键字列表被存储在HDD 2004中。如果存在已经存储的关键字列表,则把这些名词加于其中并存储(步骤S8006)。文档管理应用单元4005执行上述的关键字提取处理。 \n[0099] 然后确定是否存在下一个文本区域(步骤S8007)。如果存在下一个文本区域,则处理返回步骤S8004,以重复该处理。如果不存在下一个文本区域,则确定完成了所有区域的处理。在显示窗口6024上显示在步骤S8006存储的关键字列表(步骤S8008)。 [0100] 当用户选择要用作检索键的关键字并指示开始检索(步骤S8009)时,主单元\n2000向文档管理系统2060发出含有作为检索键的所选关键字在内的全文检索指令(步骤S8010)。然后结束处理。 \n[0101] 如上所述,按照本实施例,对应于所读取文档中的图像数据的缩略图图像的列表被显示,从而用户能够容易地从列表中选择要用作关键字的图像数据。 \n[0102] 因而,用户能够容易而简单地指定或输入用作关键字的图像数据,这增加了用户的便利性。 \n[0103] <其它实施例> \n[0104] 在上面的实施例中所述的布置、处理过程和操作显示窗口仅仅是示例。这些布置或处理过程可被改变或修正,只要可以实现本发明的目的。 \n[0105] 例如,在上面的实施例中,显示与所读取文档的图像区域对应的缩略图图像。然而,如果根据显示区域的尺寸和图像区域的数量和尺寸之间的关系,可以显示图像区域的列表,则能够以实际尺寸显示图像。在这种情况下,确定是否可以进行列表类型显示。如果无法进行列表类型显示,则可以把每个图像缩小到允许进行这种列表类型显示的尺寸,或者按照要以列表的形式显示的图像的数量改变图像的缩小比率。 \n[0106] 在上面的实施例中,在操作单元中提供的显示装置具有在显示屏幕上提供的触摸板。然而,可以使用不同于触摸板的任何其它操作装置(如,键和按钮),从所列图像中选择要用于检索的图像。 \n[0107] 图像数据的格式不限于上面实施例中所述的格式,根据需要可以使用合适的格式。 \n[0108] 上述实施例在使用图像数据作为检索键的处理与使用文本数据作 为检索键的处理之间进行区分。然而,本发明不限于此。也可以根据图像数据和字符串的OR或AND进行检索。 \n[0109] 通过向图像或文本数据的检索键添加来自所述操作的另一检索条件(如,文档创建日期/时间、更新日期/时间、存储位置、文档名、文档类型和字符串),可以进行精确的检索。 \n[0110] 除去在文档中的图像和文本数据的检索键之外,通过块选择而获得的其它的属性(表格、艺术线条或背景)也可用作检索键。 \n[0111] 上面详细说明了本发明的实施例。本发明可应用于包括多个设备的文档检索系统或包括单个设备的文档检索设备。 \n[0112] 例如,在上述实施例中,本发明应用于具有扫描仪功能、复印功能、打印机功能和传真功能的多功能外设。在这些功能当中,复印功能、传真功能和打印机功能不是重要的。\n因而,包括扫描仪(读取设备)和诸如对应于主单元和操作单元的计算机之类的信息处理设备的系统也可应用于本发明。在这种情况下,以上实施例的文档管理系统可被提供在计算机设备中,或者作为外部设备通过网络被连接。 \n[0113] 当文档管理系统是外部设备时,可以准备多个外部设备,使得用户可以指定要用来检索的外部设备。另选的,所有可检索的外部装置都可执行检索。 \n[0114] 从通过扫描仪功能读取文档而获得的图像的图像数据中提取检索键。然而,可以使用任何其它图像数据。例如,可以从通过传真接收的图像数据、经由诸如LAN 2020之类的网络通过电子邮件功能或FTP功能接收的图像数据、或者从Web服务器接收的数据中包含的图像数据中提取检索键。也可以使用从另一打印客户端接收的打印数据。用户可以经由操作单元2050选择在HDD 2004中存储的一个图像数据并提取检索键。 \n[0115] 本发明甚至通过如下方式实现:直接或者从远方对系统或设备供应软件程序,并使系统或设备的计算机读出并执行所供应的程序,所述程序实现上述实施例的功能。在上述实施例中,所述程序对应于图7和图8的流程图。如果可以获得程序的功能,则不必总是采用程序 的形式。 \n[0116] 因而,被安装在计算机中以由计算机实现本发明的功能处理的程序代码本身也实现本发明。即,本发明的权利要求还包括用于实现本发明的功能处理的计算机程序本身。 [0117] 在这种情况下,程序可以采取任何形式,例如目标代码、要由解释器执行的程序、或者要提供给OS的脚本数据,只要可以获得所述程序的这些功能。 \n[0118] 可以利用各种记录介质来提供所述程序。示例有floppy 盘、硬盘、光盘、磁光盘、MO、CD-ROM、CD-R、CD-RW、磁带、非易失存储卡、ROM、以及DVD(DVD-ROM或DVD-R)。 [0119] 为了供应程序,可以通过使用客户端计算机内的浏览器使客户端计算机连接到互联网上的主页,以便从该主页把程序下载到诸如硬盘之类的记录介质。用户可以下载本发明的计算机程序本身或者含有自动安装功能的压缩文档。 \n[0120] 在本发明的程序中包含的程序代码可被分成多个文件,从而用户可以从不同的主页上下载这些文件。即,使多个用户下载使计算机实现本发明的功能处理的程序文件的WWW服务器也被包括在本发明的权利要求内。 \n[0121] 本发明的程序可被加密,存储在诸如CD-ROM之类的存储介质中并分发给用户。满足预定条件的任何用户可以通过互联网从主页下载用于解密的密钥信息,使用该密钥信息来执行加密的程序,并把程序安装在计算机内。 \n[0122] 上述实施例的功能不仅在所读出的程序由计算机执行时才被实现。例如,当在计算机上运行的OS根据程序的指令执行实际处理的一部分或全部时,可以实现上述实施例的功能。 \n[0123] 从记录介质读出的程序可被写入插入计算机中的功能扩展板的存储器中或者写入连接到计算机的功能扩展单元中。在这种情况下,功能扩展板或功能扩展单元的CPU根据程序的指令执行实际处理的一部分或全部,由此实现上述实施例的功能。 [0124] 虽然参照示例性实施例说明了本发明,但是应当理解,本发明不限于公开的示例性实施例。下面权利要求的范围应当被给予最宽的解释,使得包括所有这些改变、等效结构和功能。 \n[0125] 本申请要求于2005年7月28日提交的日本专利申请第2005-219441号的优先权,该专利申请的全部内容通过引用被包括在本文中。
法律信息
- 2012-06-13
- 2008-09-24
- 2008-07-30
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |