著录项信息
专利名称 | 一种电子地图数据的排序方法及装置 |
申请号 | CN200810222422.8 | 申请日期 | 2008-09-16 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2009-01-21 | 公开/公告号 | CN101350154 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0;;;G;0;9;B;2;9;/;1;0;;;G;0;9;B;2;9;/;0;0查看分类表>
|
申请人 | 北京搜狗科技发展有限公司 | 申请人地址 | 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 北京搜狗科技发展有限公司 | 当前权利人 | 北京搜狗科技发展有限公司 |
发明人 | 董正斌;佟子健;王云峰;王登 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 逯长明 |
摘要
本发明公开了一种电子地图数据的排序方法及装置,以解决传统的人工排序方法造成排序效果差、耗费人力、成本太高的问题。所述方法包括:提取出每个电子地图数据的关键词;利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;根据每个电子地图数据的相应搜索结果网页集合,计算该电子地图数据的重要度;按照所述重要度对所述电子地图数据进行排序。本发明利用互联网的网络知名度来刻画POI数据的重要程度,由于这种刻画代表了广大网民乃至广大群众的认识,因此这种排序效果比较好,具有很好的群众基础和合理性。而且,使用机器自动对POI数据进行打分和排序,极大地节省了人力,效率更高,成本非常低廉。
1.一种电子地图数据的排序方法,其特征在于,包括:
提取出每个电子地图数据的关键词;
利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;
针对集合中每个搜索结果网页,分别计算用于表示网页重要程度的第一数值和用于表示网页与关键词匹配程度的第二数值,根据相应集合中所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度;
按照所述重要度对所述电子地图数据进行排序;
其中,所述根据相应集合中所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度,具体包括:
将集合中每个搜索结果网页的第一数值和第二数值相乘,然后再将集合中所有搜索结果网页的相乘结果求和,得到该电子地图数据的重要度。
2.根据权利要求1所述的方法,其特征在于:所述第一数值通过计算网页级别得到。
3.根据权利要求1所述的方法,其特征在于,所述计算该电子地图数据的重要度之后,还包括:
根据电子地图数据所属类别所具有的不同权重,将该电子地图数据的重要度乘以该电子地图数据所属类别的权重值,得到调整后的结果数据,用于排序。
4.根据权利要求1所述的方法,其特征在于,所述提取出每个电子地图数据的关键词,具体包括:
提取出每个电子地图数据的名称作为关键词。
5.根据权利要求4所述的方法,其特征在于,还包括:
提取出每个电子地图数据的地址信息,与名称一同作为关键词。
6.根据权利要求1所述的方法,其特征在于,所述提取出每个电子地图数据的关键词之前,还包括:
对原始的电子地图数据进行预处理,所述预处理包括去除无关符号、字符编码转换、调整统一格式;
将预处理结果用于关键词的提取。
7.根据权利要求1所述的方法,其特征在于,按照所述重要度对所述电子地图数据进行排序之后,还包括:
在电子地图检索中,根据用户输入的查询词返回相匹配的检索结果,将检索结果中排序靠前的电子地图数据优先显示。
8.根据权利要求1所述的方法,其特征在于,按照所述重要度对所述电子地图数据进行排序之后,还包括:
在图层显示时,选取显示范围内排序靠前的电子地图数据进行显示。
9.根据权利要求1所述的方法,其特征在于,按照所述重要度对所述电子地图数据进行排序之后,还包括:
对排序靠前的电子地图数据进行优先更新。
10.一种电子地图数据的排序装置,其特征在于,包括:
关键词提取单元,用于提取出每个电子地图数据的关键词;
查询单元,用于利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;
计算单元,包括:第一计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页重要程度的第一数值;第二计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页与关键词匹配程度的第二数值;综合计算子单元,用于根据每个电子地图数据相应集合中的所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度;
排序单元,用于按照所述重要度对所述电子地图数据进行排序;
其中,所述综合计算子单元将集合中每个搜索结果网页的第一数值和第二数值相乘,然后再将集合中所有搜索结果网页的相乘结果求和,得到该电子地图数据的重要度。
11.根据权利要求10所述的装置,其特征在于:所述第一计算子单元通过计算网页级别得到第一数值。
12.根据权利要求10所述的装置,其特征在于,所述装置还包括:
调整单元,用于根据电子地图数据所属类别所具有的不同权重,将该电子地图数据的重要度乘以该电子地图数据所属类别的权重值,得到调整后的结果数据,并输出到排序单元用于排序。
13.根据权利要求10所述的装置,其特征在于:所述关键词提取单元将提取出的电子地图数据的名称作为关键词。
14.根据权利要求13所述的装置,其特征在于:所述关键词提取单元还将提取出的电子地图数据的地址信息,与名称一同作为关键词。
15.根据权利要求10所述的装置,其特征在于,所述装置还包括:
预处理单元,用于对原始的电子地图数据进行预处理,并将预处理结果输出到关键词提取单元;其中,所述预处理包括去除无关符号、字符编码转换、调整统一格式。
16.根据权利要求10所述的装置,其特征在于,所述装置还包括:
检索单元,用于在电子地图检索中,根据用户输入的查询词返回相匹配的检索结果,将检索结果中排序靠前的电子地图数据优先显示。
17.根据权利要求10所述的装置,其特征在于,所述装置还包括:
图层显示单元,用于在图层显示时,选取显示范围内排序靠前的电子地图数据进行显示。
18.根据权利要求10所述的装置,其特征在于,所述装置还包括:
数据更新单元,用于对排序靠前的电子地图数据进行优先更新。
19.一种搜索引擎系统,其特征在于,所述系统包括权利要求10至18任一权利要求所述的装置。
一种电子地图数据的排序方法及装置\n技术领域\n[0001] 本发明涉及网络技术领域,特别是涉及一种电子地图数据的排序方法及装置。\n背景技术\n[0002] 随着地理信息系统的发展与完善,电子地图的设计开发技术也日趋成熟。电子地图中,有一类数据称为兴趣点数据(即Point of Interest,POI数据),是指人们感兴趣的数据,如餐馆、公园、商场等建筑物的地理信息,或是一些街道的信息等等。通常,POI数据包括名称、类别、经度、纬度四个方面的信息,有时也包括其他一些信息,如地址,电话、邮编等等。POI数据是电子地图最重要的元素之一,也是人们使用电子地图时最为关注的信息。\n[0003] 一个电子地图通常包含很多的POI数据,这些POI数据涵盖了该地图范围内的绝大部分地理信息。但是,该电子地图中地理信息的重要程度有所不同,如“天安门广场”比“中关村广场”重要,“北京大学”比“北京大学附属中学”重要,这种地理信息重要性的不同导致POI数据的重要性存在差异。\n[0004] POI排序是指根据POI数据重要性的不同对POI数据进行的排序,POI数据的重要性体现在其所指代地理信息的重要性。POI排序可应用在搜索引擎的排序中,即根据POI数据的重要性对电子地图的查询结果进行排序展示。\n[0005] 目前,还没有比较成熟的POI排序方法。传统上,电子地图的开发商会请一些编辑或者普通民众,根据人们对POI数据的熟悉程度来对POI数据进行排序,这种根据熟悉程度进行排序的核心思想是:如果一个POI数据所指代的地理位置非常重要,则它一定为人们所熟悉。这一思想具有一定的合理性,由于电子地图乃至实际的地理信息的使用者是普通民众,因此被普通民众熟悉的地理信息应该具有较高的重要性。\n[0006] 但是,这种方法存在如下问题:\n[0007] 第一,虽然可以用熟悉程度来刻画POI数据的重要程度,但是如何计算熟悉程度是一个非常困难的问题。因此,上述人工排序的方法由于只有极小一部分人参与,无法代表广大用户,所以排序效果没有保障,排序效果差;而且,由于人数较少,所以错误率也比较高。\n[0008] 第二,由于POI数据量极大,而且更新很快,所以采用人工进行排序非常耗费人力,而且成本非常昂贵。\n[0009] 因此,这种人工排序方法无法得到实际使用。\n发明内容\n[0010] 本发明提供一种电子地图数据的排序方法及装置,以解决传统的人工排序方法造成排序效果差、耗费人力、成本太高的问题。\n[0011] 为解决上述技术问题,根据本发明提供的具体实施例,本发明公开了以下技术方案:\n[0012] 一种电子地图数据的排序方法,包括:\n[0013] 提取出每个电子地图数据的关键词;\n[0014] 利用所述关键词搜索,获取对应每个电子地图数据的搜索结果网页集合;\n[0015] 针对集合中每个搜索结果网页,分别计算用于表示网页重要程度的第一数值和用于表示网页与关键词匹配程度的第二数值,根据相应集合中所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度;\n[0016] 按照所述重要度对所述电子地图数据进行排序;\n[0017] 其中,所述根据相应集合中所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度,具体包括:将集合中每个搜索结果网页的第一数值和第二数值相乘,然后再将集合中所有搜索结果网页的相乘结果求和,得到该电子地图数据的重要度。\n[0018] 优选的,所述第一数值通过计算网页级别得到。\n[0019] 优选的,所述计算该电子地图数据的重要度之后,还包括:根据电子地图数据所属类别所具有的不同权重,将该电子地图数据的重要度乘以该电子地图数据所属类别的权重值,得到调整后的结果数据,用于排序。\n[0020] 其中,所述提取出每个电子地图数据的关键词,具体包括:提取出每个电子地图数据的名称作为关键词。\n[0021] 优选的,还包括:提取出每个电子地图数据的地址信息,与名称一同作为关键词。\n[0022] 优选的,所述提取出每个电子地图数据的关键词之前,还包括:对原始的电子地图数据进行预处理,所述预处理包括去除无关符号、字符编码转换、调整统一格式;将预处理结果用于关键词的提取;\n[0023] 优选的,按照所述重要度对所述电子地图数据进行排序之后,还包括:在电子地图检索中,根据用户输入的查询词返回相匹配的检索结果,将检索结果中排序靠前的电子地图数据优先显示。\n[0024] 优选的,按照所述重要度对所述电子地图数据进行排序之后,还包括:在图层显示时,选取显示范围内排序靠前的电子地图数据进行显示。\n[0025] 优选的,按照所述重要度对所述电子地图数据进行排序之后,还包括:对排序靠前的电子地图数据进行优先更新。\n[0026] 本发明还提供了一种电子地图数据的排序装置,包括:\n[0027] 关键词提取单元,用于提取出每个电子地图数据的关键词;\n[0028] 查询单元,用于利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;\n[0029] 计算单元,包括:第一计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页重要程度的第一数值;第二计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页与关键词匹配程度的第二数值;综合计算子单元,用于根据每个电子地图数据相应集合中的所有搜索结果网页的第一数值和第二数值,计算该电子地图数据的重要度;\n[0030] 排序单元,用于按照所述重要度对所述电子地图数据进行排序;\n[0031] 其中,所述综合计算子单元将集合中每个搜索结果网页的第一数值和第二数值相乘,然后再将集合中所有搜索结果网页的相乘结果求和,得到该电子地图数据的重要度。\n[0032] 优选的,所述第一计算子单元通过计算网页级别得到第一数值。\n[0033] 优选的,所述装置还包括:调整单元,用于根据电子地图数据所属类别所具有的不同权重,将该电子地图数据的重要度乘以该电子地图数据所属类别的权重值,得到调整后的结果数据,并输出到排序单元用于排序。\n[0034] 其中,所述关键词提取单元将提取出的电子地图数据的名称作为关键词。\n[0035] 优选的,所述关键词提取单元还将提取出的电子地图数据的地址信息,与名称一同作为关键词。\n[0036] 优选的,所述装置还包括:预处理单元,用于对原始的电子地图数据进行预处理,并将预处理结果输出到关键词提取单元;其中,所述预处理包括去除无关符号、字符编码转换、调整统一格式。\n[0037] 优选的,所述装置还包括:检索单元,用于在电子地图检索中,根据用户输入的查询词返回相匹配的检索结果,将检索结果中排序靠前的电子地图数据优先显示。\n[0038] 优选的,所述装置还包括:图层显示单元,用于在图层显示时,选取显示范围内排序靠前的电子地图数据进行显示。\n[0039] 优选的,所述装置还包括:数据更新单元,用于对排序靠前的电子地图数据进行优先更新。\n[0040] 本发明还提供了一种搜索引擎系统,所述系统包括上述任一装置实施例所述的装置。\n[0041] 根据本发明提供的具体实施例,本发明具有以下技术效果:\n[0042] 首先,本发明利用互联网技术对POI数据进行排序,使用互联网的网络知名度来刻画POI数据的重要程度,而网络知名度是根据关键词(是从POI数据中提取出)在搜索引擎中返回的结果网页进行计算得到。由于这种刻画代表了广大网民乃至广大群众的认识,因此,利用网络知名度来对POI数据进行排序,排序的效果比较好,具有很好的群众基础和合理性。而且,使用机器自动对POI数据进行打分和排序,极大地节省了人力,效率更高,成本非常低廉。\n[0043] 其次,在利用网络知名度刻画POI数据的重要程度时,本发明主要使用了网页的重要程度、网页与关键词的匹配程度这两个指标,而且每个指标也有不同的计算方法。\n[0044] 再次,本发明还充分考虑了POI数据的类别对POI重要程度的影响,利用POI数据的类别信息来对基本的网络知名度得分进行调整从而得到POI的最终得分,从而更加准确地刻画了POI数据的重要程度。\n附图说明\n[0045] 图1是本发明实施例一所述一种电子地图数据的排序方法流程图;\n[0046] 图2是本发明实施例二所述一种POI数据的排序方法流程示意图;\n[0047] 图3是本发明实施例所述一种电子地图数据的排序装置结构图。\n具体实施方式\n[0048] 为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。\n[0049] 实施例一:\n[0050] 针对传统的POI人工排序方法,本发明实施例提供了一种利用互联网技术进行的排序方法。参照图1,是本发明实施例一所述一种电子地图数据的排序方法流程图。本实施例中,所述电子地图数据以POI数据为例进行说明,但所述电子地图数据包括但不限于POI数据。\n[0051] S101,提取出每个POI数据的关键词;\n[0052] 本实施例需要从每个POI数据中提取出一个关键词,用来在互联网的搜索引擎中进行查询。由于每个POI数据具有一些属性,包括名称、类别、坐标或其它属性信息,因此提取时可以从这些属性信息中提取出最能代表这个POI数据的词作为关键词。本实施例中,关键词的基本部分是POI的名称,因为名称是POI数据最重要的部分。\n[0053] 优选的,在提取POI数据的名称时,需要对名称进行一些处理,如去除名称中的分店、分公司等信息。因为如餐饮、公司这样的名称,里面经常存在分店、分公司的情况,而POI排序的目的是为了把总店、总公司排在靠前的位置,所以这时就可以把这种分店、分公司的字符去除。如“xx公司五道口分店”,就可以把“五道口分店”去除,只剩“xx公司”。\n[0054] 优选的,也可以加入其它一些信息作为名称的补充,如地址、区县等。因为有些名称太短,不具有实际意义,如公厕、停车场等词,这时候就可以把POI的地址加入进来,和名称一起作为关键词,这样处理的效果更好。\n[0055] S102,利用所述关键词进行搜索,获取对应每个POI数据的搜索结果网页集合;\n[0056] 上述提取出的关键词,在搜索引擎中进行查询并取得返回的结果集合。\n[0057] S103,根据每个POI数据的相应搜索结果网页集合,计算该POI数据的重要度;\n[0058] 本发明是利用互联网的网络知名度来刻画POI数据的重要程度,而POI的网络知名度是根据对应该POI的搜索结果网页集合计算。其中,所述网络知名度是指一个名称在网络中的知名程度。\n[0059] 针对每个POI数据,利用提取出的关键词进行查询能够得到多个搜索结果网页(即网页集合),而每一个网页具有两个指标:一个是网页的重要程度,另一个是网页与关键词的匹配程度。本实施例主要利用所述两个指标来衡量POI数据的网络知名度。\n[0060] 由于每种指标都有不同的计算方法,本实施例只采用其中一种比较常用的方法。\n对于网页的重要程度,采用计算网页级别(PageRank)的方法。网页的PageRank是度量网页重要程度的一种指标,是根据网页之间的超链接来进行计算,源自于Google创始人提出的PageRank算法。当然,也可以用网页的流量来表示网页的重要程度。对于网页与关键词的匹配程度(MatchRank),通常采用的计算方法是:如果关键词在网页中完整出现,则匹配程度较高,如果关键词被切分后出现,则匹配程度较低。本发明包含但不限于以上计算方法。\n[0061] 得到每个网页的PageRank和MatchRank后,将每个网页的PageRank和MatchRank相乘,然后再将对应同一个POI数据的所有网页的相乘结果相加,即得到一个POI数据的计算结果。本实施例中,采用对POI数据打分的方式,所以所述计算结果得到的是一个对该POI数据的网络知名度进行刻画的分值。\n[0062] 需要说明的是,上述根据网页的PageRank和MatchRank采用相乘再相加的计算来获得一个POI分值的方法,仅作为本实施例的一种实现方式,本发明包括但不限于所述方法。\n[0063] S104,按照所述重要度对所述POI数据进行排序。\n[0064] 得到每个POI数据的得分后,利用所述得分即可以对所有的POI数据进行排序。\n[0065] 由上述处理流程可知,本发明使用互联网的网络知名度来刻画POI数据的重要程度,由于这种刻画代表了广大网民乃至广大群众的认识,因此利用网络知名度来对POI数据进行排序,排序的效果比较好,具有很好的群众基础和合理性。而且,使用机器自动对POI数据进行打分和排序,极大地节省了人力,效率更高,成本非常低廉。\n[0066] 实施例二:\n[0067] 本发明实施例二提供了一种具体应用实例。\n[0068] 参照图2,是本发明实施例二所述一种POI数据的排序方法流程示意图。\n[0069] S201,对原始的POI数据进行预处理;\n[0070] 对原始POI数据进行清洗过滤,主要功能是使数据符合一定的输入标准。所述预处理主要包括去除无关符号、字符编码转换、调整统一格式三个部分。其中,[0071] 1)去除无关符号:由于数据的来源或者其他问题,数据中可能存在一些无关符号,这些符号没有实际意义,如!、#等符号,还有乱码等,需要将这些无关符号去除,起到一个清洗过滤作用;\n[0072] 2)字符编码转换:使字符的编码一致,可以有利于后面打分的公平。如半角转全角,繁体转简体等;\n[0073] 3)调整格式:数据的输入格式应该统一,这样利于编程。\n[0074] S202,针对预处理后的POI数据,提取出每个POI数据的关键词;\n[0075] 提取过程中,可以根据地名库和别名库识别出名称中包含的分店、分公司等信息,然后去除这些信息。例如“xx公司五道口分店”,如果“五道口”是地名库中的一个词,“分店”是特有词库中的词,这样就可以把“五道口分店”去除,只剩“xx公司”。\n[0076] S203,利用所述关键词进行搜索,获取对应每个POI数据的搜索结果网页集合;\n[0077] S204,针对每个POI数据,根据相对应的搜索结果网页集合计算得到用于表示该POI数据重要程度的基本分值;\n[0078] 本实施例中,根据网页的PageRank和MatchRank计算得到的分值作为POI数据的基本分值,这个基本分值是对该POI数据的网络知名度的刻画。\n[0079] S205,根据POI数据的类别信息调整所述基本分值;\n[0080] 由于POI数据具有很多类别,而不同类别的数据在网络上具有不同的性质。例如,餐饮类的POI数据要比政府机关类的POI数据在网络上更受到关注,但是政府机关类的POI数据要比餐饮类的POI数据更为重要,因为在实际生活中人们更关注政府机关类的POI数据。因此,为了平衡不同类别POI数据的得分,本实施例引入了类别权重,需要根据类别的权重来调整POI的基本得分,使得类别重要的POI得分提高,类别不重要的POI得分降低。\n类别的权重可以根据经验来设定,也可以使用一些训练数据来训练获得。调整过程是:用POI数据的基本得分乘以其所属类别的权重大小,这样就得到最终得分。\n[0081] 例如,有两个POI数据,一个是北京大学第三医院,一个是郭林家常菜。由于餐饮类的名称在网页中出现比较多,所以郭林家常菜的基本得分为5分,而北京大学第三医院的得分为4分。但是根据人们的经验和习惯来说,医院会比餐饮类重要,所以医院类的类别权重较大,设为1.5,而餐饮的权重较低,设为0.8。这样最终两个POI的得分分别为:北京大学第三医院4×1.5=6,郭林家常菜5×0.8=4。从而北京大学第三医院比郭林家常菜的得分高,排序靠前,这就符合了人们的一般认识。\n[0082] S206,按照所述调整后的最终分值对所述POI数据进行排序。\n[0083] 对比实施例一和实施例二,实施例二增加了预处理过程和基本分值的调整过程。\n实施例二还充分考虑了POI数据的类别对POI重要程度的影响,利用POI数据的类别信息来对基本的网络知名度得分进行调整从而得到POI的最终得分,从而更加准确地刻画了POI数据的重要程度。\n[0084] 电子地图POI数据的排序具有很多实用价值,例如:\n[0085] 1)查询检索方面:用户在电子地图查询时输入一个查询词,会返回很多检索结果,这些检索结果都与该查询词匹配,但这些结果中往往还有重要程度之分。如果对POI进行排序后,就可以在匹配的同时,把重要的POI显示在前面,不重要的放在后面,这样更方便用户使用。例如,查询“全聚德”,会出现全聚德的很多分店和一些附属公司或培训机构,它们都与这个查询词匹配,但是不能把一些附属公司和培训机构显示在前面,因为一般这些不太重要,而应该把重要的总店或者分店排在前面。再如:查询北京大学,会出现北京大学和它的附属机构,北京大学应该排在第一位,但它的众多附属机构应该有一个排序的前后之分。\n[0086] 2)图层显示方面:电子地图一般由很多图层组成,当用户在查看某个图层时,应该将该图层的POI显示出来供用户查看。但是用户在某个图层中关注点的周围也许有很多的POI,如果把这些POI全部显示出来,则整个页面会非常杂乱且臃肿,这就不利于用户查看。因此,需要按照重要程度来选取一部分POI进行显示,这样不但用户可以查看到自己需要的信息,而且整个显示效果比较好。\n[0087] 3)数据更新方面:由于POI更新速度较快,而且更新量较大,如果在精力有限的情况下可以只针对比较重要的数据先更新。\n[0088] 针对上述方法实施例,本发明还提供了一种电子地图数据的排序装置实施例。参照图3,是本发明实施例所述一种电子地图数据的排序装置结构图。所述装置主要包括:\n[0089] 关键词提取单元U32,用于提取出每个电子地图数据的关键词;\n[0090] 查询单元U33,用于利用所述关键词进行搜索,获取对应每个电子地图数据的搜索结果网页集合;\n[0091] 计算单元U34,用于根据每个电子地图数据的相应搜索结果网页集合,计算该电子地图数据的重要度;\n[0092] 排序单元U36,用于按照所述重要度对所述电子地图数据进行排序。\n[0093] 其中,所述计算单元U34具体包括:\n[0094] 第一计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页重要程度的第一数值;网页的重要程度可以由网页级别(PageRank)来表示,所以所述第一数值即指计算所得的PageRank;当然,也可以用网页的流量来表示;\n[0095] 第二计算子单元,用于针对集合中每个搜索结果网页,分别计算用于表示网页与查询词匹配程度的第二数值;网页与查询词的匹配程度(MatchRank)可以由多种方法计算得到;\n[0096] 综合计算子单元,用于针对每个电子地图数据,根据相对应集合中的所有搜索结果网页的第一数值和第二数值,计算用于表示该电子地图数据重要程度的结果数据。一种计算方式是:所述综合计算子单元将集合中每个搜索结果网页的第一数值和第二数值相乘,然后再将集合中所有搜索结果网页的相乘结果求和,得到该电子地图数据的重要程度值。\n[0097] 其中,所述关键词提取单元U32将提取出的电子地图数据的名称作为关键词;或者,将提取出的电子地图数据的地址信息,与名称一同作为关键词。优选的,在提取名称时去掉包含分店、分公司的信息。\n[0098] 优选的,在本发明的另一装置实施例中,所述装置还包括调整单元U35,用于根据电子地图数据所属类别所具有的不同权重,将该电子地图数据的重要度乘以该电子地图数据所属类别的权重值,得到调整后的结果数据,并输出到排序单元U36用于排序。\n[0099] 优选的,在本发明的另一装置实施例中,所述装置还包括预处理单元U31,用于对原始的电子地图数据进行预处理,并将预处理结果输出到关键词提取单元U32;其中,所述预处理包括去除无关符号、进行字符编码转换、调整统一格式。\n[0100] 优选的,在本发明的另一装置实施例中,所述装置还包括检索单元U37,用于在电子地图检索中,根据用户输入的查询词返回相匹配的检索结果,将检索结果中排序靠前的电子地图数据优先显示。\n[0101] 优选的,在本发明的另一装置实施例中,所述装置还包括图层显示单元U38,用于在图层显示时,选取显示范围内排序靠前的电子地图数据进行显示。\n[0102] 优选的,在本发明的另一装置实施例中,所述装置还包括数据更新单元U39,用于对排序靠前的电子地图数据进行优先更新。\n[0103] 图3所示装置中未详述的部分可以参见图1、图2所示方法的相关部分,为了篇幅考虑,在此不再详述。\n[0104] 此外,本发明还提供了一种搜索引擎系统,所述系统包括上述任一装置实施例所述的装置。所述搜索引擎系统在电子地图数据的搜索应用方面,能够提供更加优质的检索结果。\n[0105] 以上对本发明所提供的一种电子地图数据的排序方法及装置,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。
法律信息
- 2013-09-25
专利权的转移
登记生效日: 2013.09.02
专利权人由北京搜狐新媒体信息技术有限公司变更为北京搜狗科技发展有限公司
地址由100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦8层802房间变更为100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间
- 2013-01-30
- 2010-12-01
专利申请权的转移
登记生效日: 2010.10.20
申请人由北京搜狗科技发展有限公司变更为北京搜狐新媒体信息技术有限公司
地址由100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间变更为100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦8层802房间
- 2009-03-11
- 2009-01-21
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-07-18
|
2006-01-11
| | |
2
| |
2003-01-08
|
2002-02-06
| | |
3
| |
2006-08-30
|
2005-11-25
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |