著录项信息
专利名称 | 信息检索装置和方法 |
申请号 | CN99104149.6 | 申请日期 | 1999-03-17 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 1999-09-22 | 公开/公告号 | CN1229218 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 松下电器产业株式会社 | 申请人地址 | 日本国大阪府
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 松下电器产业株式会社 | 当前权利人 | 松下电器产业株式会社 |
发明人 | 伊藤正雄;小山隆正 |
代理机构 | 上海专利商标事务所 | 代理人 | 沈昭坤 |
摘要
本发明揭示一种包括多个搜索引擎,从而可迅速得到文献目录的信息检索装置。该装置包括:传送经客户单元接收的检索请求的通信单元,多个根据要求的检索条件检索数据并分类检索的数据的搜索引擎,分类全部搜索引擎检索的数据的总分类单元。用上述构成,通过部分取出各搜索引擎检索的数据,即可迅速制订期望的文献目录。
1、一种信息检索装置,其特征在于包括:
(a)多个索引存储单元,每个用于存储索引信息数据;
(b)多个文献目录存储单元,每个用于存储文献目录信息数据;
(c)多个搜索引擎,可各自检索存储在所述索引存储单元中的所述索引信息 数据,获得作为检索结果的命中数,检索存储在所述文献目录存储单元中的文献 目录信息数据,根据预定标准给所述检索的文献目录信息数据评分,并以所述评 分顺序分类所述检索的文献目录信息数据;
(d)总分类单元,该单元选择一些检索的文献目录信息数据,汇总所述选择 的数据,根据所述搜索引擎所加的评分分类所述汇总的数据,根据所述分类的数 据制定表,所述表根据所述评分整理。
2、如权利要求1所述的信息检索装置,其特征在于,进一步包括:
(a)处理检索请求的客户单元;
(b)通信单元,该单元向所述搜索引擎和所述总分类单元传送经所述客户单 元的所述检索请求,并向所述客户单元回送所述搜索引擎和所述总分类单元进行 的分类结果。
3、如权利要求1所述的信息检索装置,其特征在于,所述总分类单元,当 所述信息数据由所述搜索引擎以降序分类时,从所述分类结果的始端起从所述搜 索引擎获得一些所述分类数据;当数据信息数据以升序分类时,从所述分类结果 的末端起从所述搜索引擎获得一些所述分类数据。
4、如权利要求2所述的信息检索装置,其特征在于,所述通信单元保持各 搜索引擎的命中数,不请求不命中的来自所述搜索引擎的检索数据。
5、如权利要求1所述的信息检索装置,其特征在于,当取出位于作为检索 结果的命中的后半部的所述信息数据时,若所述信息数据由所述搜索引擎以降序 分类,则所述总分类单元从未端起从所述搜索引擎取出一些所述分类信息数据; 若所述信息数据由所述搜索引擎以升序分类,则从始端起取出一些所述分类信息 数据。
6、如权利要求1所述的信息检索装置,其特征在于,所述总分类单元(a)按 照使各级间包含的范围相等,把最大评分划为“p”级;(b)从所述搜索引擎取出 评分不小于各评分级最低值的所述信息数据的命中数;(c)汇总所述命中数;(d) 根据文献目录的所述数据的位置制订文献目录表;其中“p”是不小于2的整数。
7、如权利要求6所述的信息检索装置,其特征在于,“p”根据命中数设置。
8、如权利要求1所述的信息检索装置,其特征在于,所述总分类单元,以 下述两种方法之一,从所述搜索引擎接收一些所述信息数据;
(a)当所述信息数据由所述搜索引擎以降序分类时,从始端起取出信息数据, 和
(b)当所述信息数据由所述搜索引擎以升序分类时,从末端起取出信息数据; 及
从所述搜索引擎取出评分不小于各评分级最低值的所述信息数据命中数,所 述评分级设置成,按照使各级间包含的范围相等,把全部评分划成“p”级,其 中“p”是不小于2的整数。
9、如权利要求1所述的信息检索装置,其特征在于,所述总分类单元包括 存储从所述各搜索引擎接收的评分的评分存储单元。
10、如权利要求1所述的信息检索装置,其特征在于,所述总分类单元进一 步包括存储从所述各搜索引擎获得的所述命中数分布的评分分布存储单元。
11、如权利要求1所述的信息检索装置,其特征在于,当取位于从所述全部 命中数始端起大于A%的后半部分的信息数据时,若所述信息数据以降序分类, 则所述总分类单元从所述搜索引擎取出从所述分类信息数据未端至B%该分类信 息数据的预定数量所述信息数据;若所述数据以升序分类,则取出从所述分类数 据始端至B%该分类数据的预定数量所述信息数据;其中A≤50、B≤50。
12、一种检索信息的方法,其特征在于包括下述步骤:
(a)检索信息数据;
(b)给所述检索的信息数据评分并按所加评分的顺序分类加有评分的所述信 息数据;
(c)汇总一些所述分类的信息数据,以所加评分的顺序分类汇总的所述信息 数据,通过从所述分类的信息数据始端起按序使用一些所述信息数据制订文献目 录表。
13、如权利要求12所述的检索信息方法,其特征在于,进一步包括下述步 骤:当所述信息数据由所述各搜索引擎按降序分类时,从所述分类结果始端起按 序从所述搜索引擎取出一些所述分类信息数据;当所述信息数据按升序分类时, 从所述分类结果末端起按序取出一些所述分类信息数据。
14、如权利要求12所述的检索信息方法,其特征在于,进一步包括下述步 骤:按照使各级间包含的范围相等,把最大评分划分“p”级;从所述搜索引擎 取出评分不小于各评分级最低值的所述信息数据的命中数;汇总所述命中数;根 据文献目录的数据位置制订文献目录表;其中“p”是不小于2的整数。
15、如权利要求12所述的检索信息方法,其特征在于,进一步包括下述步 骤:
(a)并行检索索引数据并传送作为检索结果的命中数;
(b)取出所述信息数据;给所述信息数据评分;分类加有所述评分的所述信 息数据;
(c)取出一些所述分类的信息数据;汇总所述信息数据;分类加有评分的信 息数据;通过从所述分类的信息数据始端起以所加评分的顺序使用一些所述信息 数据制订文献目录。
本发明涉及具有多个搜索引擎(search engine)的信息检索装置和方法,借助于 该装置和方法,可通过检索文献的电子数据,迅速制订文献目录(著录项目)。\n近年来,随着字处理器和个人计算机的普及,人们关注文献数据库,在该数 据库中储存大量的文献信息并可在任何时候,从存储的数据检索需要的文献信 息。一种称为全文检索系统的检索系统正引人注目,在该系统中可从文献内容检 索无关键字文献数据。该系统用于检索来自因特网等网络的主页。通过把用户计 算机连至服务器/客户机模型或全球网信息服务系统(万维网)(WWW),用户可使用 该检索系统。在该系统中,通过显示各自有检索文献数据的文献目录,可同时处 理多个用户的检索请求,即,多个用户可同时检索储存的数据。而且,在该系统 中,检索的数据不按进入的顺序输出,而是根据按照数据和检索条件之间预定的 标准加至各数据的评分输出。该系统可响应于用户请求输出数据。通过赋予序号 并根据对各数据所给定的权重给评分来执行上述对数据加评分,例如,对具有较 少词的文献给较高评分或按所用词给不同评分(如根据预定词出现的频度给出权 重)等。文献目录除文献号外还包括主页标题或URL(Universal Resource Locator)(统一资源定位器)。\n下文叙述一传统的信息检索装置。图12表示以往信息检索装置的框图,它 包括客户单元121-1、121-2、……121-n,通信单元122,搜索引擎123, 索引存储单元124和文献目录存储单元125。\n下文叙述具有上述构成的常规的信息检索装置的工作。首先,客户单元121 -1、121-2、……121-n向通信单元122传送来自多个用户的检索请求。 然后,通信单元122存储该请求并向搜索引擎123传送该请求。搜索引擎123以 索引存储单元124读出索引,快速检索该索引数据并把命中数送回通信单元 122。然后,通信单元122把命中数送回客户单元121-1、121-2、…121 -n。\n然后,客户单元121-1、121-2、……121-n向通信单元122传送获 得具有上述索引检索所命中的文献数据的文献目录的请求。通信单元122向搜索 引擎123传送该请求。搜索引擎123从文献目录存储单元125读出文献数据,制 订文献目录并向通信单元122回送。通信单元122又把它回送至客户单元121- 1、121-2、……121-n。\n在上述常规构成中,存在当存储几千万文献时,硬盘和存储器的存储量和性 能不足的问题。在这种情况下,由于一台计算机难于处理数据,必须使用多台计 算机,所以检索涉及多个搜索引擎。这样,搜索引擎间的通信负荷就变大,因而 检索性能不足。\n本发明信息检索装置和方法的第1个特点是,它包括至少多个各自独立地检 索文献数据,制订文献目录并按预定标准分类检索所得文献的搜索引擎、存储执 行检索用的索引数据的索引存储单元、存储文献目录数据的文献目录存储单元和 分类由搜索引擎检索的所有数据的总分类单元(global sort unit)。在上述构成中, 能用部分取出各搜索引擎检索的数据(即按照从始端起的位置顺序取出预定量的 数据)的方法,快速制订文献目录。在这种情况下,根据按预定标准加至各数据的 评分分类数据。\n本发明第2个特点是,在从位于全部检索数据的后半部分的数据获得文献目 录时,总分类单元以从末端起的位置顺序,取搜索引擎检索的数据。换句话说, 总分类单元根据待取数据从始端或末端数的位置号及待取数据量,部分取出各搜 索引擎检索历史中的数据。用这种方法,可快速制订文献目录。\n本发明第3个特点是,总分类单元首先从各搜索引擎接收命中分布,即,按 照使各级间包含的范围相等,把评分划分“p”(“p”是不小于2的整数)级, 并汇总评分不小于各级最低值的数据量,由此可找出所要求文献目录的数据所处 的范围。基于此,总分类单元再次从各搜索引擎取命中分布。然后,从该分布, 通过计算找出所需数据的位置,从而部分取出评分。用这种方法可迅速制订所需 的文献目录。\n图1是本发明第1示范实施例的信息检索装置的框图。\n图2A至图2C表示第1示范实施例中搜索引擎工作的一个例子。\n图3表示第1示范实施例中总分类单元工作的一个例子。\n图4A至4D表示第1示范实施例中制订文献目录的一个例子。\n图5是本发明第2示范实施例的信息检索装置的框图。\n图6是本发明第3示范实施例的信息检索装置的框图。\n图7A至7D表示本发明第3示范实施例中,创建评分分布的一个例子。\n图8表示在第1示范实施例中,文献数据命中数搜索过程的流程图。\n图9是第1示范实施例中制订文献目录过程的流程图。\n图10是第2示范实施例中制订文献目录过程的流程图。\n图11是第3示范实施例中制订文献目录过程的流程图。\n图12是以往信息检索装置的框图。\n第1示范实施例\n下文参照图1-4、8及图9,叙述本发明第1示范实施例的信息检索装置。\n如图1所示,信息检索装置包括:客户单元11-1、11-2、…11-n, 通信单元12,搜索引擎13-1、13-2、……13-n,总分类单元14,评分 存储单元15,索引存储单元16和文献目录存储单元17。\n下文说明具有上述构成的信息检索装置的工作。\n图8是本示范实施例搜索文献命中数的处理流程图。首先,各客户单元11 -1、11-2…11-n接收用户检索请求(图8的801框)并向通信单元12传送 该请求。然后,通信单元12请求各搜索引擎13-1、13-2、…13-n搜索 命中数(802)。各搜索引擎13-1、13-2、…13-n搜索索引数据(803),检 索索引数据(804)并向通信单元12回送各命中数。通信单元12汇总从各搜索引擎 13-1、13-2、…13-n接收的命中数(805),并向客户单元回送该汇总的命 中数。\n图9是本示范实施例制订文献目录的处理流程图。客户单元11-1、11- 2、…11-n接收用户对文献目录的请求(图9框901)并向通信单元12传送该请 求。通信单元12向总分类单元14传送文献目录所用信息数据的起始号码及该数 据待取出的数量(902)。总分类单元14请求各搜索引擎13-1、13-2、…13 -n搜索作为检索结果的检索历史的信息数据。同时,总分类单元14请求搜索 引擎13-1、13-2、…13-n对从{取数据的起始号}至({取数据的起始号}+{待 取数据数}-1)命中段,按预定标准提供评分并送回带评分的命中数。然后,搜 索引擎13-1、13-2、…13-n检索检索历史的数据(903),给检索数据评 分,以评分顺序分类数据,并向总分类单元14回送要求数量的含评分检索历史 数据(904),总分类单元14在分类存储单元15中存储接收的评分并以评分的顺序 分类数据(905)。总分类单元14通过计算为各搜索引擎13-1、13-2、…13 -n找出待取数据的起始号码和数量(906)。然后,总分类单元14向各搜索引擎 13-1、13-2、…13-n传送待取数据的起始号码和数量(907)。各搜索引擎 13-1、13-2、…13-n从起始号起依序读出检索历史的文献号,并从文献 目录存储单元17读出与各文献号相应的文献目录数据(908)后,向总分类单元14 送回读出的文献数据。总分类单元14汇总、分类从搜索引擎13-1、13-2、… 13-n接收的数据并制订所要求的文献目录(909),然后向通信单元12回送。通 信单元12向客户单元11-1、11-2、…11-n回送文献目录,从而过程完 成(910)。\n图2A至图2C表示存储在搜索引擎13-1、13-2、…13-n中,作为 检索结果数据的检索历史的一个例子。这里,叙述n=3,即3个搜索引擎的例子。 第1搜索引擎的检索历史21、第2搜索引擎的检索历史22、第3搜索引擎的检 索历史23分别示于图2A、2B、2C。在各检索历史中,数据按评分递减的顺 序分类。在这些检索历史中,当通过取从起始号为“1”开始的10个数据评分 制订文献目录时,总分类单元14请求搜索引擎13-1、13-2、…13-n各 取10(1+10-1=10)个待取数据的评分。搜索引擎13-1、13-2、…13 -n按照请求取出10个评分的例子示于图2A、2B、2C的标号24、25和26。 本例中,取出有较高评分的数据。来自第1、第2、第3搜索引擎的10个评分 24、25和26分别示于图2A、2B、2C。这样,各搜索引擎可取出有较高评分 的数据。\n图3的表31表示图2A至2C的24、25和26中数据汇总结果的30个评分, 即从3个搜索引擎各取10个检索数据的检索历史,它们由总分类单元14分类。 在该例子中,因取出数据的起始号是“1”且待取数据数是“10”,具有图3 号“1”至号“10”的检索数据的历史构成文献目录,向客户单元11-1、11 -2、…11-n回送。图3的标号32表示由图3中标号31得到的3个搜索引擎 上待取数据的起始号和数据量。在本例子中,第1搜索引擎待取出数据的起始号 是“1”,数据数量是“2”,第2搜索引擎的待取出数据的起始号是“1”且 数据数量是“4”;第3搜索引擎的待取数据的起始号是“1”且数据量是“4”。 如上例所述,通过由总分类单元14把评分分类,可为各搜索引擎13-1、13 -2、…13-n找出待取数据的起始号和数据量。\n图4A至4D表示通过根据待取数据的起始号和数据数量取数据而制订文献 目录的过程。\n在图4A至4C中,各搜索引擎13-1、13-2、…13-n从各检索历史 41、42、43中找出文献号,从文献目录存储单元17读出与这些文献号相应的 文献数据并向总分类单元14回送读出的文献数据。然后,总分类单元14,通过 以评分顺序分类文献数据,从搜索引擎13-1、13-2、…13-n接收的文献 数据制订要求的文献目录并向通信单元12回送该文献目录。\n如上所述,通过按照各检索引擎上待取数据的起始号和数据数量取出数据并 对该取出数据分类,可制订文献目录。\n如上所述,在本示范实施例中,即使信息检索装置使用多个搜索引擎时,通 过设置总分类单元和评分存储单元,能以部分取出检索历史中的必要数据的方 式,从按预定标准给予评分的数据,迅速制订要求的文献目录。\n在本示范实施例中,可有各种情况,即一台计算机包括客户单元、通信单元、 搜索引擎和总分类单元,但上述各单元的功能由分开的多个计算机各自执行,或 者上述单元的某些功能由一台计算机执行。\n同时,在本示范实施例中,通信单元保持各搜索引擎的命中数并向总分类单 元传送该命中数。于是,总分类单元不请求把数据取至未命中的搜索引擎,由此, 可缩短与总分类单元的通信时间。 第2示范实施例\n下文,参照图5和图10叙述第2示范实施例的信息检索装置。\n如图5所示,本示范实施例的信息检索装置包括:客户单元51-1、51- 2、…51-n,通信单元52,搜索引擎53-1、53-2、…53-n,索引存 储单元56和文献目录存储单元57。上述构成部件的结构和功能与图1的第1示 范实施例的相同。与第1示范实施例的不同处在于,总分类单元及评分存储单元 的功能,在本示范实施例中,根据从搜索引擎的检索历史取数据的起始号,自动 选择以高评分或低评分的顺序取出数据,而在第1示范实施例中,以高评分的顺 序取出并存储数据。在这种情况下,根据预定标准,给各数据评分。\n例如,当新的报纸文章在该文章未按日期顺序存储而希望取出时,新文章可 通过从末端搜索而有效地检索。\n下文叙述具有上述构成的信息检索装置的工作。\n搜索文献数据命中数的过程与第1示范实施例中所述的图8的过程相同。 即,客户单元51-1、51-2、…51-n向通信单元52传送用户检索请求。 然后,通信单元52请求各搜索引擎53-1、53-2、…53-n搜索命中数。 各搜索引擎53-1、53-2、…53-n读出并检索存储在索引存储单元56中 的索引数据并向通信单元52回送命中数。通信单元52汇总从搜索引擎53-1、 53-2、…53-n接收的命中数并向客户单元51回送汇总的命中数。\n图10是本示范实施例中制订文献目录过程的流程图。客户单元51-1、51 -2、…51-n接收用户的文献目录请求(图10的标号1001)并向通信单元52 传送该请求。然后,通信单元52向总分类单元54传送取数据的起始号及待取数 据数(1002)。总分类单元54请求各搜索引擎53-1、53-2、…53-n搜索 检索历史的数据。\n在这种情况下,当起始号大于命中总数的一半时(1004),总分类单元54请求 各搜索引擎53-1、53-2、…53-n根据预定标准给位于从各历史末尾起顺 序计算的位置“a”至“b”的数据评分,并把所给的评分回送给总分类单元54。 在这种情况下,“b”=({总命中数}-{起始号}-{待取数据数}+2);而“a” =({总命中数}-{起始号}+1)。然后,搜索引擎53-1、53-2、…53-n 检索各检索历史的数据(1003),加上评分,以评分递降的顺序分类检索数据并通 过以从存储数据末尾起的位置顺序取数据,向总分类单元54回送要求数量的含 评分检索历史数据(1005)。\n而当取数据的起始号小于命中总数的一半时,总分类单元54请求搜索引擎 53-1、53-2、…53-n,给从各检索历史始端顺序计算的{取数据的起始 号}位置至({取数据的起始号}+{待取数据数}-1)位置的数据评分,并回送该评 分至总分类单元54。然后,搜索引擎53-1、53-2、…53-n检索检索历 史的数据,加上评分,以降序分类并通过从存储数据始端起的位置顺序取出数 据,向总分类单元54回送要求数量的含评分检索历史(1006)。然后,总分类单元 54汇总接收的数据并在评分存储单元55中存储数据。在这种情况下,在存储单 元55中存储前,数据以下述方式分类:当接收数据是按从始端起的位置顺序取 出时,评分以降序分类(1008),而当接收数据是按从末端起的位置顺序取出时, 评分在升序分类(1007)。总分类单元54从上述存储数据选择要求数量的数据,并 对各搜索引擎53-1、53-2、…53-n找出所取数据的起始号及待取数据量 (1009)并向各搜索引擎53-1、53-2、…53-n传送这些数(1010)。然后, 各搜索引擎53-1、53-2、…53-n从起始号开始按序读出检索历史的文献 号,再从文献目录存储单元57读出相应于该文献号的文献(1011),向总分类单元 54传送读出的文献数据。总分类单元54以评分顺序汇总并分类接收的文献数据, 从而完成文献目录(1012),然后向通信单元52回送。通信单元52又把它回送至 客户单元51-1、51-2、…51-n,从而过程完成(1013)。\n如上所述,由于总分类单元依照文献目录数据的取出位置,从始端或末端部 分取出检索历史的数据,可减少送回总分类单元的数据量。因此,可减少总分类 单元分类的数据量,由此,可更迅速地得到文献目录。\n在本示范实施例的上述叙述中,当取数据的起始号小于命中数据总数的一半 时,在搜索引擎中以降序分类数据并按从检索历史末端起的位置顺序取出数据。 但是,通过把搜索引擎的分类方法从降序变为升序,可从始端起的位置顺序取出 数据。\n当制订具有位于整个数据A%(A≤50)以后的文献数据的文献目录时,还有一 种首先取出从末端至B%(B≤50)数据的方法。该方法在命中数大时,是较有效的 检索数据方法。 第3示范实施例\n下文,参照图6、7和11,叙述本发明第3示范实施例的信息检索装置。\n图6表示本示范实施例的信息检索装置的框图。如图6所示,本示范实施例 的信息检索装置包括:客户单元61-1、61-2、…61-n,通信单元62, 搜索引擎63-1、63-2、…63-n,索引存储单元67,和文献目录存储单 元68。上述构成部件的结构与功能与图1的第1示范实施例的部件相同。与第1 示范实施例的不同点在于,总分类单元64、评分存储单元65和评分分布存储单 元66的构成和功能。在获取文献目录时,总分类单元64从各搜索引擎63-1、 63-2、…63-n取出预定评分范围的命中分布信息并按各评分级汇总命中数(累 加),由此,可减少从搜索引擎63-1、63-2、…63-n取出的评分数。\n下文叙述具有上述构成的信息检索装置的工作。\n搜索文献数据命中数的过程与第1示范实施例的图8所示相同。即,客户单 元61-1、61-2、…61-n接收用户检索请求并向通信单元62传送该请求。 然后,通信单元62请求各搜索引擎63-1、63-2、…63-n搜索命中数。 搜索引擎63-1、63-2、…63-n从索引存储单元67读出索引数据并检索 该索引数据,向通信单元62回送命中数。通信单元62汇总从搜索引擎63-1、 63-2、…63-n接收的命中数并向客户单元61-1、61-2、…61-n回 送汇总的命中数。\n图11是本示范实施例中制订文献目录过程的流程图。首先,客户单元61- 1、61-2、…61-n接收文献目录请求(图11的框1101),然后,向通信单元 62传送该请求。通信单元向总分类单元64传送数据的起始号及待取数据的数量 (1102)。然后,全球分类单元64请求搜索引擎63-1、63-2、…63-n以 下述方式搜索检索历史的数据。即,按照使各级间包含的范围相等,把最大评分 为“m”(这时最小评分为“0”)的整个命中评分划为“p”级,汇总评分不低 于各级最低值的命中数,从而找出各评分级的命中分布(1103)。详细而言,搜索 引擎63-1、63-2、…63-n搜索检索功史的数据(1104),找出评分不小于 各评分级最低值的命中数(1105),向总分类单元64回送该结果。总分类单元64 汇总接收的数据并得出汇总评分分布(1106),然后,在评分分布存储单元66中存 储汇总的评分分布(1106)。从汇总的评分分布可找出取所请求文献目录数据的起 始号的评分范围。根据上述结果,总分类单元64通过计算找出值小于“s”的 “c”个评分及该评分的序号并请求搜索引擎63-1、63-2、…63-n再次 回送检索历史数据(1107)。在这种情况下,“c”=({取数据的起始号}-{评分不 小于起始号所处上述评分范围最低值的命中数}+{待取数据数}-1)。搜索引擎 63-1、63-2、…63-n读出要求的数据并向总分类单元64回送读出的数 据(1108)。总分类单元64以评分顺序汇总接收的数据并分类该数据,找出取数据 的起始号位置(1109)并向各搜索引擎63-1、63-2、…63-n传送该起始号 和待取数据的数量(1110)。各搜索引擎63-1、63-2、…63-n按照从起始 号起的位置顺序读出检索历史的文献号并从文献目录存储单元68读出相应于该 文献号的文献数据(1111)后,向总分类单元64回送读出数据。总分类单元64汇 总从各搜索引擎63-1、63-2、…63-n接收的数据并按评分顺序分类该数 据,由此制订要求的文献目录表(1112)并向通信单元62回送。通信单元62向客 户单元61-1、61-2、…61-n送回文献目录表,从而完成过程(1113)。\n图7A至7D表示上述评分分布的一个例子。图7A、7B和7C表示各搜索引 擎中的分布,从中可找出评分不小于各评分级最低值的命中总数。然后,向分类 单元64回送各分布并由总分类单元64如图7D所示加以汇总。在本例中,当取 数据的起始号是501及待取数据数是20时,因评分不小于800的命中数是476 而评分不小于600的命中数是750,所以起始号501的评分小于800但大于600。 于是,总分类单元64从搜索引擎取出44(501-476+20-1=44)个评分(其评 分值小于800)及相应的序号。总分类单元64以降序分类接收的评分并从第25(501 -476)起取20个评分。然后,总分类单元64从搜索引擎63-1、63-2、… 63-n取出要求的文献目录的数据。\n在第3示范实施例中,按照使各级间包含的范围相等,把检索历史分成“p” 级,它可根据命中数改变。当命中数大时,“p”设置得大,而当命中数小时, “p”设置得小。而且,“p”可以调节成使各评分范围内的命中数变得大致彼 此相等。\n同时,在第3示范实施例中,总分类单元可根据命中数及要求的文献目录的 取出位置,组合第1和第2示范实施例的方法进行检索。例如,当命中数小(如约 100)时,检索最好以第1示范实施例的方式进行而不必做出评分分布。即使选中 数大,若待取数据仅是从始端起大约20时,也最好用第1示范实施例的方法进 行检索而不必作出评分分布。\n第3示范实施例中,在总分类单元把最大评分值设定为“m”。“m”值 可是搜索命中数时最大评分值中的一个。\n在第1示范实施例中,根据为表明检索请求和文献数据之间关系而加的评分 进行检索历史分类。评分可以是日期等第2和第3示范实施例可用的数字信息。\n如上所述,本发明可取得下述效果。\n首先,本发明的信息检索装置包括多个各自可独立检索文献数据,制订文献 目录并根据预定标准分类检索所得文献数据的搜索引擎、存储执行检索用的索引 数据的索引存储单元、存储文献目录数据的文献目录存储单元,和分类由搜索引 擎检索的全部数据的总分类单元。在上述构成中,能用部分取出各搜索引擎检索 数据(即按照从始端起的位置顺序取出预定量数据)的方法,迅速制订文献目录。 在这种情况下,根据按预定标准加至各数据的评分分类数据。\n第二,在从位于全部检索数据后半部分的数据获得文献目录时,总分类单元 按从未端起的位置顺序取搜索引擎检索的数据。换句话说,总分类单元根据从待 取数据始端或末端待取数据的位置号及数据量,部分取出各搜索引擎的检索历史 中的数据。用这种方法,可迅速制订文献目录。\n第三,总分类单元首先从各搜索引擎接收命中分布,即,按照使各级间包含 的范围相等,把评分划分p级(p是不小于2的整数),并汇总评分不小于各级最低 值的数据数,由此,可找出所要求文献目录的数据所处的范围。基于此,总分类 单元再次从各搜索引擎取命中分布。由该分布,通过计算可找出所需数据的位 置,从而部分取出评分。用这种方法,可迅速制订所需的文献目录。
法律信息
- 2011-05-25
未缴年费专利权终止
IPC(主分类): G06F 17/30
专利号: ZL 99104149.6
申请日: 1999.03.17
授权公告日: 2003.07.16
- 2003-07-16
- 2001-05-30
- 1999-09-22
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2007-10-24 | 2007-10-24 | | |
2 | | 2005-03-16 | 2005-03-16 | | |
3 | | 2005-05-19 | 2005-05-19 | | |