著录项信息
专利名称 | 一种用于查询主体的关联信息的方法和装置 |
申请号 | CN201510284223.X | 申请日期 | 2015-05-28 |
法律状态 | 授权 | 申报国家 | 暂无 |
公开/公告日 | 2015-09-16 | 公开/公告号 | CN104915395A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 百度在线网络技术(北京)有限公司 | 申请人地址 | 北京市海淀区上地十街10号百度大厦三层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 百度在线网络技术(北京)有限公司 | 当前权利人 | 百度在线网络技术(北京)有限公司 |
发明人 | 苏俊杰;崔燕;张铮;谭静;常冰心;周启;瞿庆羽;侯晓冉 |
代理机构 | 广州三环专利商标代理有限公司 | 代理人 | 温旭;郝传鑫 |
摘要
本发明提供了用于查询主体的关联信息的方法和装置。该方法包括:获取用户输入的主体的名称关键词,将名称关键词进行分字以获取该名称关键词对应的一个以上字,在主体数据库检索主体的名称中包含所述一个以上字的主体的标识码,根据标识码在关联信息数据库查询所述标识码对应主体的关联信息。实施本发明提供的方法和装置,能够使查询结果不受检索关键词的输入顺序限制,扩展检索结果,避免主体漏检,改善获取主体的关联信息的效率。
1.一种用于查询主体的关联信息的方法,其特征在于,包括:
获取用户输入的所述主体的名称关键词,
将所述名称关键词进行分字以获取所述名称关键词对应的一个以上字,
在主体数据库检索主体的名称中包含所述一个以上字的主体的标识码,
根据所述标识码在关联信息数据库查询所述标识码对应主体的关联信息;
将所述标识码对应主体的关联信息按照所述标识码对应主体的名称与所述名称关键词中字的顺序的一致性程度进行排序展示。
2.根据权利要求1所述的方法,其特征在于,所述主体包括:法人或向客户提供服务的自然人。
3.根据权利要求2所述的方法,其特征在于,所述关联信息包括下述信息中的一种或多种:名称信息、信用信息、经营信息、地址信息、网站信息、类型信息。
4.根据权利要求1所述的方法,其特征在于,还包括:
定期或实时更新所述关联信息数据库中的关联信息。
5.根据权利要求4所述的方法,其特征在于,所述定期或实时更新包括:通过传输总线接收更新的主体的关联信息的消息,将所述消息推入redsi队列,根据所述消息的类型将消息发送至所述关联信息数据库。
6.一种用于查询主体的关联信息的装置,其特征在于,包括:
获取模块,用于获取用户输入的所述主体的名称关键词,
分字模块,用于将所述名称关键词进行分字以获取所述名称关键词对应的一个以上字,
检索模块,用于在主体数据库检索主体的名称中包含所述一个以上字的主体的标识码,
查询模块,用于根据所述标识码在关联信息数据库查询所述标识码对应主体的关联信息,
展示模块,用于将所述标识码对应主体的关联信息按照所述标识码对应主体的名称与所述名称关键词中字的顺序的一致性程度进行排序展示。
7.根据权利要求6所述的装置,其特征在于,所述主体包括:法人或向客户提供服务的自然人。
8.根据权利要求7所述的装置,其特征在于,所述关联信息包括下述信息中的一种或多种:名称信息、信用信息、经营信息、地址信息、网站信息、类型信息。
9.根据权利要求6所述的装置,其特征在于,还包括:
更新模块,用于定期或实时更新所述关联信息数据库中的关联信息。
10.根据权利要求9所述的装置,其特征在于,所述更新模块的所述定期或实时更新包括:通过传输总线接收更新的主体的关联信息的消息,将所述消息推入redsi队列,根据所述消息的类型将消息发送至所述关联信息数据库。
一种用于查询主体的关联信息的方法和装置\n技术领域\n[0001] 本发明涉及互联网领域,具体而言,涉及一种用于查询主体的关联信息的方法和装置。\n背景技术\n[0002] 随着互联网相关技术的普及和数据的急速膨胀,各式各样的数据充斥在网络中,这些数据的数量庞大并且零散纷乱。当网民意图通过互联网获取某些主体(例如,法人等)的相关信息时,所获取的相关数据纷杂凌乱,需要花费大量时间和精力梳理相关数据,有用数据的获取效率较低。\n发明内容\n[0003] 为解决上述的技术问题,本发明提供了一种用于查询主体的关联信息的方法和装置,通过将用户需要查询的主体的名称关键词进行分字,检索主体数据库中名称包含名称关键词的各分字的全部主体的标识码,根据标识码获取相应主体的关联信息,输入待查询主体的名称关键词即可获取包含该名称关键词的所有主体的关联信息,而不受名称关键词中字的输入顺序的限制,显著改善了主体的关联信息的获取效率。\n[0004] 根据本发明实施方式的第一方面,提供了一种用于查询主体的关联信息的方法,该方法可包括:获取用户输入的所述主体的名称关键词,将所述名称关键词进行分字以获取所述名称关键词对应的一个以上字,在主体数据库检索主体的名称中包含所述一个以上字的主体的标识码,根据所述标识码在关联信息数据库查询所述标识码对应主体的关联信息。\n[0005] 在本发明的一些实施方式中,所述主体包括:法人或向客户提供服务的自然人。\n[0006] 在本发明的一些实施方式中,所述关联信息可包括下述信息中的一种或多种:名称信息、信用信息、经营信息、地址信息、网站信息、类型信息。\n[0007] 在本发明的一些实施方式中,用于查询主体的关联信息的方法还可包括:将所述标识码对应主体的关联信息按照所述标识码对应主体的名称与所述名称关键词中字的顺序的一致性程度进行排序展示。\n[0008] 在本发明的一些实施方式中,用于查询主体的关联信息的方法还可包括:定期或实时更新所述关联信息数据库中的关联信息。\n[0009] 在本发明的一些实施方式中,所述定期或实时更新可包括:通过传输总线接收更新的主体的关联信息的消息,将所述消息推入redsi队列,根据所述消息的类型将消息发送至所述关联信息数据库。\n[0010] 根据本发明实施方式的第二方面,提供了一种用于查询主体的关联信息的装置,该装置可包括:获取模块,用于获取用户输入的所述主体的名称关键词,分字模块,用于将所述名称关键词进行分字以获取所述名称关键词对应的一个以上字,检索模块,用于在主体数据库检索主体的名称中包含所述一个以上字的主体的标识码,查询模块,用于根据所述标识码在关联信息数据库查询所述标识码对应主体的关联信息。\n[0011] 在本发明的一些实施方式中,所述主体可包括:法人或向客户提供服务的自然人。\n[0012] 在本发明的一些实施方式中,所述关联信息可包括下述信息中的一种或多种:名称信息、信用信息、经营信息、地址信息、网站信息、类型信息。\n[0013] 在本发明的一些实施方式中,用于查询主体的关联信息的装置还可包括:展示模块,用于将所述标识码对应主体的关联信息按照所述标识码对应主体的名称与所述名称关键词中字的顺序的一致性程度进行排序展示。\n[0014] 在本发明的一些实施方式中,用于查询主体的关联信息的装置还可包括:更新模块,用于定期或实时更新所述关联信息数据库中的关联信息。\n[0015] 在本发明的一些实施方式中,所述更新模块的所述定期或实时更新包括:通过传输总线接收更新的主体的关联信息的消息,将所述消息推入redsi队列,根据所述消息的类型将消息发送至所述关联信息数据库。\n[0016] 本发明实施方式提供的用于查询主体的关联信息的方法和装置,对用户输入的名称关键词进行分字,检索包括这些分字的全部主体及其关联信息,而不限定各字的输入顺序,降低了对用户检索表达式的要求,避免了部分主体漏检,有利于扩展检索结果;而且,通过对关联信息数据库的定期或实时更新,可改善检索结果的准确度。\n附图说明\n[0017] 图1图示了根据本发明实施方式的用于查询主体的关联信息的方法的流程示意图。\n[0018] 图2图示了根据本发明实施方式的检索结果的网页示意图;\n[0019] 图3图示了根据本发明实施方式的检索结果的网页示意图;\n[0020] 图4图示了根据本发明实施方式的用于查询主体的关联信息的装置的结构示意图。\n具体实施方式\n[0021] 为使本发明的实施方式的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述。\n[0022] 参见图1,图示了根据本发明实施方式的用于查询主体的关联信息的方法的流程示意图,该方法可包括:\n[0023] S101,获取用户输入的主体的名称关键词,\n[0024] S102,将名称关键词进行分字以获取该名称关键词对应的一个以上字,[0025] S103,在主体数据库检索主体的名称中包含所述一个以上字的主体的标识码,[0026] S104,根据标识码在关联信息数据库查询该标识码对应主体的关联信息。\n[0027] 在本发明的实施方式中,用于查询主体的关联信息的方法可包括:执行步骤S101,获取用户输入的主体的名称关键词。例如,在用户的终端设备(例如,台式电脑、平板电脑或智能手机等)联网的情况下,获取用户在终端设备的搜索页面(例如,http://faren.baidu.com/等)输入的待查询的主体的名称关键词,例如,可以是一个字或多于一个字的名称关键词,该名称关键词可以是待查询主体的名称的一部分或全部。\n[0028] 本发明实施方式的主体可包括法人,例如,企业法人、机关法人、社会团体法人、事业单位法人等,还可包括向客户(例如,个人或企业等)提供服务的自然人,例如,律师、会计师及个体工商户等。主体的关联信息可包括,但不限于下述信息中的一种或多种(例如,大于或等于两种):名称信息(例如,可包括法人的名称、简称等,自然人的姓名、别称等)、信用信息(例如,可包括基础信誉、良好信誉、优质信誉三种类型,每种信誉等级可通过数值量化并且可相互转换)、地址信息(例如,法人的工商地址,自然人的办公地址等)、经营信息(例如,法人的经营范围或行政职能等,自然人的执业范围等)、网站信息(例如,法人的官网,自然人的社交主页等)、类型信息(例如,法人的类型为企业、学校等,自然人的类型为律师、会计师等)。\n[0029] 接下来,执行步骤S102,对步骤S101中获取的名称关键词进行分字,获取该名称关键词对应的一个以上字。名称关键词中包括N(N为大于等于1的正整数)个字,分字后可获取它对应的N个字。\n[0030] 接着,执行步骤S103,在主体数据库查询主体的名称中包含步骤S102分字后的各字对应的主体,并获取该主体对应的标识码,例如,可以是一个主体及其对应的一个标识码,也可以是多个(例如,两个以上)主体各自对应的多个标识码。其中,主体数据库中存储有主体的名称及其对应的标识码的索引信息。例如,可通过读取指定格式的XML(Extensible Markup Language,可扩展标记语言)文件生成索引。例如,指定的XML格式可以如下:\n[0031]\n[0032] 在主体数据库中,一个主体具有一个主体名称,该主体通过唯一一个标识码进行标识,主体与标识码为一一对应关系。步骤S103中,在主体数据库中查询主体的名称中同时包含名称关键字各分字的所有主体,而不限定各分字在检索出的主体名称中的顺序,例如,可包括主体名称与名称关键词中字的输入顺序一致的主体,还可包括主体名称与名称关键词中字的输入顺序不一致的主体。如图2所示,输入名称关键词“北京百度技术”,可检索到北京百度糯米信息技术有限公司等与名称关键词“北京百度技术”的字的输入顺序一致的主体,还可检索到与名称关键词“北京百度技术”的字的顺序不一致的主体,例如,百度在线网络技术北京有限公司等。\n[0033] 本发明实施方式的主体检索方式不限定关键词输入顺序的检索,降低了对用户检索表达式的要求,有利于扩展用户的检索结果。由于主体的名称所涉及的范围相对整个互联网的数据而言较小,通过同时包含检索名称关键词的各个字所有主体,在保证检索效率的前提下,可有效避免部分主体漏检,提高用户对检索结果的满意度。\n[0034] 接下来,执行步骤S104,根据步骤S103中检索得到标识码(例如,一个或多个)在关联信息数据库中查询这个或这些标识码对应主体的关联信息。在关联信息数据库中存储有主体(例如,法人和向诸如企业、个人之类客户提供服务的自然人等)、该主体的标识码以及该主体的诸如信用信息、网址信息、地址信息之类的关联信息等。检索到的主体的关联信息可以在网页上通过卡片(例如,矩形卡片或椭圆形卡片等)的形式向用户展现,其中检索结果的展现形式可由用户通过预先的设置确定。如图2所示,图示了以矩形卡片展示的主体的关联信息,这些主体包括北京百度糯米信息技术有限公司、百度在线网络技术北京有限公司等,主体的关联信息包括名称信息、网站信息和主体识别码信息。在本发明的一些实施方式中,矩形卡片是可点击的,点击矩形卡片可链接到更为具体的关联信息页面。例如,点击图2中的北京百度糯米信息技术有限公司,可显示如图3所示的中间页面。\n[0035] 在本发明的一些实施方式中,本发明的方法还可以包括:将步骤S104查询到的标识码对应主体的关联信息按照标识码对应主体的名称与步骤S101获取的名称关键词中字的顺序的一致性程度向用户进行排序展示,例如,首先展示主体的名称与名称关键词中字的顺序完全相同的主体关联信息,然后展示主体的名称与名称关键词中字的顺序不完全相同的主体关联信息。以输入名称关键词“北京百度技术”为例,可检索到图2所示的检索结果,这些检索结果中,会显示检索到的主体数量为3个,首先展示与名称关键词“北京百度技术”中六个字的顺序一致的主体的关联信息,例如,北京百度糯米信息技术有限公司,然后展示与北京百度技术顺序不完全一致的主体的关联信息,例如,百度在线网络技术北京有限公司等。\n[0036] 在本发明的一些实施方式中,本发明的方法还可以包括定期或实时更新关联信息数据库中的关联信息。由于各种法人主体或自然人主体的各类关联信息经常发生变化,为了确保主体的关联信息的准确度,可以每隔5分钟、10分钟、1小时、2小时、1天、10天、1月等定期对关联数据库中的主体及其关联信息进行更新。通过对关联信息数据库的更新可获得更新的主体的名称信息,从关联信息数据库导出主体数据库指定格式的XML文件,根据读取的该XML文件可生成索引,对主体数据库的主体和标识码进行相应的更新。对关联信息数据库和主体数据库的及时更新,可提高检索结果的准确度。为了进一步提高检索结果的准确度,还可以对关联信息数据库中的关联信息进行实时更新。例如,通过传输总线的接收端接收收集系统收集的推广用户、认证用户、口碑用户等(这些用户包括法人或自然人等)的关联信息,这些关联信息以消息的形式进行传输,每一条消息都具有一个消息类型,传输总线将这些消息形式的数据推入redsi队列,传输总线的发送端根据这些消息的类型获取该消息需要发送的接收方,调用对接收方的数据接口将该消息发送至对应的接收方——关联信息数据库。在redsi队列中的消息发送完毕,传输总线从redsi队列中弹出。关联信息数据库为redsi库,其中关联信息主要为json格式的字符串。\n[0037] 以上结合具体实施方式阐述了本发明的用于查询主体的关联信息的方法,下面结合具体实施方式阐述实现上述方法对应的用于查询主体的关联信息的装置。\n[0038] 参见图4,图示了根据本发明实施方式的用于查询主体的关联信息的装置的结构示意图,该装置200可包括:\n[0039] 获取模块201,用于获取用户输入的所述主体的名称关键词,\n[0040] 分字模块202,用于将所述名称关键词进行分字以获取所述名称关键词对应的一个以上字,\n[0041] 检索模块203,用于在主体数据库检索主体的名称中包含所述一个以上字的主体的标识码,\n[0042] 查询模块204,用于根据所述标识码在关联信息数据库查询所述标识码对应主体的关联信息。\n[0043] 本发明实施方式的用于查询主体的关联信息的装置200可包括获取模块201、分字模块202、检索模块203和查询模块204,这些模块可设置在用于检索的服务器设备上,并且可与服务器设备上的其他模块进行通讯连接,供其他模块调用,或调用其他模块。\n[0044] 获取模块201获取用户输入的主体的名称关键词。例如,在用户的终端设备(例如,台式电脑、平板电脑或智能手机等)联网的情况下,获取用户在终端设备的搜索页面(例如,http://faren.baidu.com/等)输入的待查询的主体的名称关键词,例如,可以是一个字或多于一个字的名称关键词,该名称关键词可以是待查询主体的名称的一部分或全部。\n[0045] 本发明实施方式的主体可包括法人,例如,企业法人、机关法人、社会团体法人、事业单位法人等,还可包括向客户(例如,个人或企业等)提供服务的自然人,例如,律师、会计师及个体工商户等。主体的关联信息可包括,但不限于下述信息中的一种或多种(例如,大于或等于两种):名称信息(例如,可包括法人的名称、简称等,自然人的姓名、别称等)、信用信息(例如,可包括基础信誉、良好信誉、优质信誉三种类型,每种信誉等级可通过数值量化并且可相互转换)、地址信息(例如,法人的工商地址,自然人的办公地址等)、经营信息(例如,法人的经营范围或行政职能等,自然人的执业范围等)、网站信息(例如,法人的官网,自然人的社交主页等)、类型信息(例如,法人的类型为企业、学校等,自然人的类型为律师、会计师等)。\n[0046] 分字模块202对获取模块201获取的名称关键词进行分字,获取该名称关键词对应的一个以上字。名称关键词中包括N(N为大于等于1的正整数)个字,分字后可获取它对应的N个字。\n[0047] 检索模块203根据分字模块202中得到的分字在主体数据库中查询主体的名称中包含名称关键词的各分字对应的主体,并获取该主体对应的标识码,例如,可以是一个主体及其对应的一个标识码,也可以是多个(例如,两个以上)主体各自对应的多个标识码。其中,主体数据库中存储有主体的名称及其对应的标识码的索引信息。例如,可通过读取指定格式的XML文件生成索引。\n[0048] 在主体数据库中,一个主体具有一个主体名称,该主体通过唯一一个标识码进行标识,主体与标识码为一一对应关系。在主体数据库中查询主体的名称中同时包含名称关键字各分字的所有主体,而不限定各分字在检索出的主体名称中的顺序,例如,可包括主体名称与名称关键词中字的输入顺序一致的主体,还可包括主体名称与名称关键词中字的输入顺序不一致的主体。如图2所示,输入名称关键词“北京百度技术”,可检索到北京百度糯米信息技术有限公司与名称关键词“北京百度技术”的字的输入顺序一致的主体,还可检索到与名称关键词“北京百度技术”的字的顺序不一致的主体,例如,百度在线网络技术北京有限公司等。\n[0049] 本发明实施方式的主体检索方式不限定关键词输入顺序的检索,降低了对用户检索表达式的要求,有利于扩展用户的检索结果。由于主体的名称所涉及的范围相对整个互联网的数据而言较小,通过同时包含检索名称关键词的各个字所有主体,在保证检索效率的前提下,可有效避免部分主体漏检,提高用户对检索结果的满意度。\n[0050] 查询模块204根据检索模块203中检索得到的标识码(例如,一个或多个)在关联信息数据库中查询这个或这些标识码对应主体的关联信息。在关联信息数据库中存储有主体(例如,法人和向诸如企业、个人之类客户提供服务的自然人等)、该主体的标识码以及该主体的诸如信用信息、网址信息、地址信息之类的关联信息等。检索到的主体的关联信息可以在网页上通过卡片(例如,矩形卡片或椭圆形卡片等)的形式向用户展现,其中检索结果的展现形式可由用户通过预先的设置确定。如图2所示,图示了以矩形卡片展示的主体的关联信息,这些主体包括北京百度糯米信息技术有限公司、百度在线网络技术北京有限公司等,主体的关联信息包括名称信息、网站信息和主体识别码信息。在本发明的一些实施方式中,矩形卡片是可点击的,点击矩形卡片可链接到更为具体的关联信息页面。例如,点击图2中的北京百度糯米信息技术有限公司,可显示如图3所示的中间页面。\n[0051] 在本发明的一些实施方式中,用户查询主体的关联信息的装置200还可包括展示模块,该展示模块将查询模块204查询到的标识码对应主体的关联信息按照标识码对应主体的名称与步骤S101获取的名称关键词中字的顺序的一致性程度向用户进行排序展示,例如,首先展示主体的名称与名称关键词中字的顺序完全相同的主体关联信息,然后展示主体的名称与名称关键词中字的顺序不完全相同的主体关联信息。以输入名称关键词“北京百度技术”为例,可检索到图2所示的检索结果,这些检索结果中,首先展示与名称关键词“北京百度技术”中六个字的顺序一致的主体的关联信息,例如,北京百度糯米信息技术有限公司,然后展示与北京百度技术顺序不完全一致的主体的关联信息,例如,百度在线网络技术北京有限公司等。\n[0052] 在本发明的一些实施方式中,用于查询主体的关联信息的装置200还可包括更新模块,该更新模块用于由于各种法人主体或自然人主体的各类关联信息经常发生变化,为了确保主体的关联信息的准确度,可以每隔5分钟、10分钟、1小时、2小时、1天、10天、1月等定期对关联数据库中的主体及其关联信息进行更新。通过对关联信息数据库的更新可获得更新的主体的名称信息,从关联信息数据库导出主体数据库指定格式的XML文件,根据读取的该XML文件可生成索引,对主体数据库的主体和标识码进行相应的更新。对关联信息数据库和主体数据库的及时更新,可提高检索结果的准确度。为了进一步提高检索结果的准确度,还可以对关联信息数据库中的关联信息进行实时更新。例如,通过传输总线的接收端接收收集系统收集的推广用户、认证用户、口碑用户等(这些用户包括法人或自然人等)的关联信息,这些关联信息以消息的形式进行传输,每一条消息都具有一个消息类型,传输总线将这些消息形式的数据推入redsi队列,传输总线的发送端根据这些消息的类型获取该消息需要发送的接收方,调用对接收方的数据接口将该消息发送至对应的接收方——关联信息数据库。在redsi队列中的消息发送完毕,传输总线从redsi队列中弹出。关联信息数据库为redsi库,其中关联信息主要为json格式的字符串。\n[0053] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件结合硬件平台的方式来实现,当然也可以全部通过硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,智能手机或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。\n[0054] 本发明说明书中使用的术语和措辞仅仅为了举例说明,并不意味构成限定。本领域技术人员应当理解,在不脱离所公开的实施方式的基本原理的前提下,对上述实施方式中的各细节可进行各种变化。因此,本发明的范围只由权利要求确定,在权利要求中,除非另有说明,所有的术语应按最宽泛合理的意思进行理解。
法律信息
- 2018-11-09
- 2015-10-14
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201510284223.X
申请日: 2015.05.28
- 2015-09-16
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2008-06-25
|
2007-08-17
| | |
2
| |
2008-06-25
|
2007-08-17
| | |
3
| |
2002-02-13
|
2001-09-05
| | |
4
| |
2006-02-08
|
2005-07-08
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |