著录项信息
专利名称 | 一种兴趣点搜索方法和装置 |
申请号 | CN201310651478.6 | 申请日期 | 2013-12-03 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2015-06-03 | 公开/公告号 | CN104679801A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F16/909 | IPC分类号 | G;0;6;F;1;6;/;9;0;9查看分类表>
|
申请人 | 高德软件有限公司 | 申请人地址 | 浙江省杭州市滨江区长河街道网商路699号4号楼5楼508室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 阿里巴巴(中国)有限公司 | 当前权利人 | 阿里巴巴(中国)有限公司 |
发明人 | 郭涛 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 王学强 |
摘要
本发明公开一种兴趣点搜索方法和装置,对用户输入的查询词进行语义解析得到用户查询意图,以提高POI搜索准确性。方法包括:对用户输入的查询词进行地址级别标注得到地址级别片段;按照地址级别片段的行政区划级别由高到低的顺序进行排序,并将排序后的地址级别片段组合得到修正后的查询词;根据排序后的地址级别片段的行政区划级别和预设城市代码对应的城市的行政区划级别,对预设城市代码进行修正;根据修正后的查询词和修正后的城市代码进行地理编码,得到包括行政地址级别信息和地理范围的地理编码信息;比较行政地址级别信息与排序后的地址级别片段,对地理范围进行修正;根据修正后的查询词,在修正后的地理范围内进行兴趣点搜索。
1.一种兴趣点搜索方法,其特征在于,包括:
接收用户输入的查询词;
对所述查询词进行地址级别标注,得到组成所述查询词的地址级别片段;
按照地址级别片段的行政区划级别由高到低的顺序,对组成所述查询词的地址级别片段进行排序,将地址级别片段按排序后的顺序进行组合,得到修正后的查询词;
确定用户的预设城市代码,并根据排序后的地址级别片段的行政区划级别和预设城市代码所对应的城市的行政区划级别,对所述预设的城市代码进行修正,得到修正后的城市代码;
根据修正后的查询词和修正后的城市代码进行地理编码,得到对应的地理编码信息,所述地理编码信息包括行政地址级别信息和地理范围;
将所述行政地址级别信息与所述排序后的地址级别片段进行比较,根据比较结果对所述地理范围进行修正,得到修正后的地理范围;
根据修正后的查询词,在修正后的地理范围内进行兴趣点搜索,得到搜索结果;
其中,将所述行政地址级别信息与所述排序后的地址级别片段进行比较,根据比较结果对所述地理范围进行修正,具体包括:
确定出排序后的地址级别片段中与地理编码信息中行政地址级别片段信息内容一致的地址级别片段,并将内容一致的地址级别片段中行政区划级别最低的地址级别片段的行政区划级别作为临界级别;
将排序后的地址级别片段中行政区划级别低于所述临界级别的地址级别片段合并为一个非地址串;
当所述非地址串不为门牌号,且为可修饰词时,则:若所述非地址串的前一个地址级别片段不带行政区划后缀,将所述非地址串与其前一个地址级别片段进行合并,得到新的非地址串;
对排序后的地址级别片段中除所述新的非地址串的其他地址级别片段进行地理编码,得到新的地理编码信息,根据新的地理编码信息中的地理范围修正对 所述修正后的查询词进行地理编码得到的地理编码信息中的地理范围。
2.根据权利要求1所述的方法,其特征在于,按照地址级别片段的行政区划级别由高到低的顺序,对组成所述查询词的地址级别片段进行排序,具体包括:
组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别比第N-1个地址级别片段的行政区划级别高,且,所述第N个地址级别片段带有行政区划后缀,则交换第N-1个和第N个地址级别片段的位置;
和/或,
组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别比第N-1个地址级别片段的行政区划级别高,且所述第N个地址级别片段不带行政区划后缀但其是组成所述查询词的最后一个地址级别片段,则交换第N-1个和第N个地址级别片段的位置,并在第N个地址级别片段中添加与该第N个地址级别片段的行政区划级别相对应的行政区划后缀。
3.根据权利要求1所述的方法,其特征在于,所述根据排序后的地址级别片段的行政区划的级别和预设的城市代码所对应的城市的行政区划级别,对所述预设的城市代码进行修正,具体包括:
如果排序后的地址级别片段中行政区划级别最大的地址级别片段存在多个,则确定出该多个地址级别片段中带有行政区划后缀的地址级别片段,并将排在最前面的带有行政区划后缀的地址级别片段所对应的城市代码替换预设的城市代码;
和/或,
如果排序后的地址级别片段中存在行政区划级别比预设的城市代码所对应的城市的行政区划级别高的地址级别片段时,或者,修正后的地址级别片段中存在与所述预设的城市代码所对应的城市的行政区划级别相同的地址级别片段时,则:若该地址级别片段带有行政区划后缀,或者该地址级别片段不带行政区划后缀但其是组成所述查询词的最后一个地址级别片段,则将该地址级别片段对应的行政区划的城市代码替换所述预设的城市代码。
4.如权利要求1-3任一项所述的方法,其特征在于,根据修正后的查询词,在修正后的地理编码信息中的地理范围内进行兴趣点搜索,具体包括:
将所述修正后的查询词作为关键词,在修正后的地理范围内进行兴趣点搜索;
若有结果,则将该结果确定为搜索结果;
若无结果,则对所述修正后的查询词进行切分,得到组成所述查询词的分词,并根据组成所述查询词的分词在所述修正后的地理范围内进行兴趣点搜索。
5.一种兴趣点搜索装置,其特征在于,包括:
查询词接收单元,用于接收用户输入的查询词;
标注单元,用于对所述查询词进行地址级别标注,得到组成所述查询词的地址级别片段;
排序单元,用于按照地址级别片段的行政区划级别由高到低的顺序,对组成所述查询词的地址级别片段进行排序,将地址级别片段按排序后的顺序进行组合,得到修正后的查询词;
城市代码修正单元,用于确定用户的预设城市代码,并根据排序后的地址级别片段的行政区划级别和预设的城市代码所对应的城市的行政区划级别,对所述预设的城市代码进行修正,得到修正后的城市代码;
地理编码单元,用于根据修正后的查询词和修正后的城市代码进行地理编码,得到对应的地理编码信息,所述地理编码信息包括行政地址级别信息和地理范围;
地理范围修正单元,用于将所述行政地址级别信息与所述排序后的地址级别片段进行比较,根据比较结果对所述地理范围进行修正,得到修正后的地理范围;
搜索单元,用于根据修正后的查询词,在修正后的地理范围内进行兴趣点搜索,得到搜索结果;
其中,所述地理范围修正单元,具体用于:
确定出排序后的地址级别片段中与地理编码信息中行政地址级别片段信息内容一致的地址级别片段,并将内容一致的地址级别片段中行政区划级别最低的地址级别片段的行政区划级别作为临界级别;
将排序后的地址级别片段中行政区划级别低于所述临界级别的地址级别片段合并为一个非地址串;
当所述非地址串不为门牌号,且为可修饰词时,则:若所述非地址串的前一个地址级别片段不带行政区划后缀,将所述非地址串与其前一个地址级别片段进行合并,得到新的非地址串;
对排序后的地址级别片段中除所述新的非地址串的其他地址级别片段进行地理编码,得到新的地理编码信息,根据新的地理编码信息中的地理范围修正对 所述修正后的查询词进行地理编码得到的地理编码信息中的地理范围。
6.根据权利要求5所述的装置,其特征在于,所述排序单元,具体用于:
组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别比第N-1个地址级别片段的行政区划级别高,且,所述第N个地址级别片段带有行政区划后缀,则交换第N-1个和第N个地址级别片段的位置;和/或,
组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别比第N-1个地址级别片段的行政区划级别高,且所述第N个地址级别片段不带行政区划后缀但其是组成所述查询词的最后一个地址级别片段,则交换第N-1个和第N个地址级别片段的位置,并在第N个地址级别片段中添加与该第N个地址级别片段的行政区划级别相对应的行政区划后缀。
7.根据权利要求5所述的装置,其特征在于,所述城市代码修正单元,具体用于:
如果排序后的地址级别片段中行政区划级别最大的地址级别片段存在多个,则确定出该多个地址级别片段中带有行政区划后缀的地址级别片段,并将排在最前面的带有行政区划后缀的地址级别片段所对应的城市代码替换预设的城市代码;
和/或,
如果排序后的地址级别片段中存在行政区划级别比预设的城市代码所对应的城市的行政区划级别高的地址级别片段时,或者,修正后的地址级别片段中存在与所述预设的城市代码所对应的城市的行政区划级别相同的地址级别片段时,则:若该地址级别片段带有行政区划后缀,或者该地址级别片段不带行政区划后缀但其是组成所述查询词的最后一个地址级别片段,则将该地址级别片段对应的行政区划的城市代码替换所述预设的城市代码。
8.根据权利要求5~7任一项所述的装置,其特征在于,所述搜索单元,具体用于:
将所述修正后的查询词作为关键词,在修正后的地理范围内进行兴趣点搜索;
若有结果,则将该结果确定为搜索结果;
若无结果,则对所述修正后的查询词进行切分,得到组成所述查询词的分词,并根据组成所述查询词的分词在所述修正后的地理范围内进行兴趣点搜索。
一种兴趣点搜索方法和装置\n技术领域\n[0001] 本发明涉及地理信息技术领域,特别涉及兴趣点搜索方法和装置。\n背景技术\n[0002] 目前,通过信息搜索引擎来进行POI(Point of Interest,兴趣点)搜索,已经成为人们获取POI的主要手段之一。一般情况下,信息搜索引擎会根据用户输入的查询词进行用户的查询意图分析,再根据分析得到的查询意图进行POI搜索,将搜索得到的POI信息反馈\n给用户。\n[0003] 目前,根据用户输入的查询词确定用户的查询意图比较宽泛,即识别出用户大体\n想要关注的领域即可,并不会对用户输入的查询词进行语义解析来得到用户的查询意图。\n比如用户输入的查询词为“足球”,则信息搜索引擎会将足球领域的相关信息(如足球体育明星)作为搜索结果反馈给用户。但是对于有些POI搜索,用户输入的查询词错误或者有歧义,信息搜索引擎并不能准确的分析出用户的查询意图,如用户输入“上海华亭宾馆”,用户是想查询上海市的“华亭宾馆”还是想查询上海市华亭镇的所有宾馆;又如用户输入“天津河北大厦”,用户是想查询天津市的“河北大厦”,还是想查询河北省的“天津大厦”,目前的信息搜索引擎并不能准确的分析出用户的查询意图,因此导致POI搜索的准确性较低。\n发明内容\n[0004] 本发明实施例提供兴趣点搜索方法和装置,能够对用户输入的查询词进行语义解\n析,得到用户较为准确的查询意图,从而提高兴趣点搜索的准确性。\n[0005] 本发明实施例提供一种兴趣点搜索方法,包括:\n[0006] 接收用户输入的查询词;\n[0007] 对所述查询词进行地址级别标注,得到组成所述查询词的地址级别片段;\n[0008] 按照地址级别片段的行政区划级别由高到低的顺序,对组成所述查询词的地址级\n别片段进行排序,将地址级别片段按排序后的顺序进行组合,得到修正后的查询词;\n[0009] 确定用户的预设城市代码,并根据排序后的地址级别片段的行政区划级别和预设\n的城市代码所对应的城市的行政区划级别,对所述预设的城市代码进行修正,得到修正后\n的城市代码;\n[0010] 根据修正后的查询词和修正后的城市代码进行地理编码,得到对应的地理编码信\n息,所述地理编码信息包括行政地址级别信息和地理范围;\n[0011] 将所述行政地址级别信息与所述排序后的地址级别片段进行比较,根据比较结果\n对所述地理范围进行修正,得到修正后的地理范围;\n[0012] 根据修正后的查询词,在修正后的地理范围内进行兴趣点搜索,得到搜索结果。\n[0013] 优选地,所述按照地址级别片段的行政区划级别由高到低的顺序,对组成所述查\n询词的地址级别片段进行排序,具体包括:组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别比第N-1个地址级别片段的行政区划级别高,且,所述第N个\n地址级别片段带有行政区划后缀,则交换第N-1个和第N个地址级别片段的位置;和/或,组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别比第N-1个地址\n级别片段的行政区划级别高,且所述第N个地址级别片段不带行政区划后缀但其是组成所\n述查询词的最后一个地址级别片段,则交换第N-1个和第N个地址级别片段的位置,并在第N个地址级别片段中添加与该第N个地址级别片段的行政区划级别相对应的行政区划后缀。\n[0014] 优选地,所述根据排序后的地址级别片段的行政区划的级别和预设的城市代码所\n对应的城市的行政区划级别,对所述预设的城市代码进行修正,具体包括:\n[0015] 如果排序后的地址级别片段中行政区划级别最大的地址级别片段存在多个,则确\n定出该多个地址级别片段中带有行政区划后缀的地址级别片段,并将排在最前面的带有行\n政区划后缀的地址级别片段所对应的城市代码替换预设的城市代码;和/或,如果排序后的地址级别片段中存在行政区划级别比预设的城市代码所对应的城市的行政区划级别高的\n地址级别片段时,或者,修正后的地址级别片段中存在与所述预设的城市代码所对应的城\n市的行政区划级别相同的地址级别片段时,则:若该地址级别片段带有行政区划后缀,或者该地址级别片段不带行政区划后缀但其是组成所述查询词的最后一个地址级别片段,则将\n该地址级别片段对应的行政区划的城市代码替换所述预设的城市代码。\n[0016] 优选地,将所述行政地址级别信息与所述排序后的地址级别片段进行比较,根据\n比较结果对所述地理范围进行修正,具体包括:确定出排序后的地址级别片段中与地理编\n码信息中行政地址级别片段信息内容一致的地址级别片段,并将内容一致的地址级别片段\n中行政区划级别最低的地址级别片段的行政区划级别作为临界级别;将排序后的地址级别\n片段中行政区划级别低于所述临界级别的地址级别片段合并为一个非地址串;当所述非地\n址串不为门牌号,且为可修饰词时,则:若所述非地址串的前一个地址级别片段不带行政区划后缀,将所述非地址串与其前一个地址级别片段进行合并,得到新的非地址串;对排序后的地址级别片段中除所述新的非地址串的其他地址级别片段进行地理编码,得到新的地理\n编码信息,根据新的地理编码信息中的地理范围修正所述对修正后的查询词进行地理编码\n得到的地理编码信息中的地理范围。\n[0017] 优选地,所述根据修正后的查询词,在修正后的地理编码信息中的地理范围内进\n行兴趣点搜索,具体包括:\n[0018] 将所述修正后的查询词作为关键词,在修正后的地理范围内进行兴趣点搜索;若\n有结果,则将该结果确定为搜索结果;若无结果,则对所述修正后的查询词进行切分,得到组成所述查询词的分词,并根据组成所述查询词的分词在所述修正后的地理范围内进行兴\n趣点搜索。\n[0019] 本发明实施例提供一种兴趣点搜索装置,包括:\n[0020] 查询词接收单元,用于接收用户输入的查询词;\n[0021] 标注单元,用于对所述查询词进行地址级别标注,得到组成所述查询词的地址级\n别片段;\n[0022] 排序单元,用于按照地址级别片段的行政区划级别由高到低的顺序,对组成所述\n查询词的地址级别片段进行排序,将地址级别片段按排序后的顺序进行组合,得到修正后\n的查询词;\n[0023] 城市代码修正单元,用于确定用户的预设城市代码,并根据排序后的地址级别片\n段的行政区划级别和预设的城市代码所对应的城市的行政区划级别,对所述预设的城市代\n码进行修正,得到修正后的城市代码;\n[0024] 地理编码单元,用于根据修正后的查询词和修正后的城市代码进行地理编码,得\n到对应的地理编码信息,所述地理编码信息包括行政地址级别信息和地理范围;\n[0025] 地理范围修正单元,用于将所述行政地址级别信息与所述排序后的地址级别片段\n进行比较,根据比较结果对所述地理范围进行修正,得到修正后的地理范围;\n[0026] 搜索单元,用于根据修正后的查询词,在修正后的地理范围内进行兴趣点搜索,得到搜索结果。\n[0027] 优选地,所述排序单元,具体用于:\n[0028] 组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别比\n第N-1个地址级别片段的行政区划级别高,且,所述第N个地址级别片段带有行政区划后缀,则交换第N-1个和第N个地址级别片段的位置;和/或,\n[0029] 组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别比\n第N-1个地址级别片段的行政区划级别高,且所述第N个地址级别片段不带行政区划后缀但\n其是组成所述查询词的最后一个地址级别片段,则交换第N-1个和第N个地址级别片段的位\n置,并在第N个地址级别片段中添加与该第N个地址级别片段的行政区划级别相对应的行政\n区划后缀。\n[0030] 优选地,所述城市代码修正单元,具体用于:\n[0031] 如果排序后的地址级别片段中行政区划级别最大的地址级别片段存在多个,则确\n定出该多个地址级别片段中带有行政区划后缀的地址级别片段,并将排在最前面的带有行\n政区划后缀的地址级别片段所对应的城市代码替换预设的城市代码;和/或,如果排序后的地址级别片段中存在行政区划级别比预设的城市代码所对应的城市的行政区划级别高的\n地址级别片段时,或者,修正后的地址级别片段中存在与所述预设的城市代码所对应的城\n市的行政区划级别相同的地址级别片段时,则:若该地址级别片段带有行政区划后缀,或者该地址级别片段不带行政区划后缀但其是组成所述查询词的最后一个地址级别片段,则将\n该地址级别片段对应的行政区划的城市代码替换所述预设的城市代码。\n[0032] 优选地,所述地理范围修正单元,具体用于:\n[0033] 确定出排序后的地址级别片段中与地理编码信息中行政地址级别片段信息内容\n一致的地址级别片段,并将内容一致的地址级别片段中行政区划级别最低的地址级别片段\n的行政区划级别作为临界级别;将排序后的地址级别片段中行政区划级别低于所述临界级\n别的地址级别片段合并为一个非地址串;当所述非地址串不为门牌号,且为可修饰词时,\n则:若所述非地址串的前一个地址级别片段不带行政区划后缀,将所述非地址串与其前一\n个地址级别片段进行合并,得到新的非地址串;对排序后的地址级别片段中除所述新的非\n地址串的其他地址级别片段进行地理编码,得到新的地理编码信息,根据新的地理编码信\n息中的地理范围修正所述对修正后的查询词进行地理编码得到的地理编码信息中的地理\n范围。\n[0034] 优选地,所述搜索单元,具体用于:\n[0035] 将所述修正后的查询词作为关键词,在修正后的地理范围内进行兴趣点搜索;若\n有结果,则将该结果确定为搜索结果;若无结果,则对所述修正后的查询词进行切分,得到组成所述查询词的分词,并根据组成所述查询词的分词在所述修正后的地理范围内进行兴\n趣点搜索。\n[0036] 本发明实施例提供的兴趣点搜索方法中,一方面,在接收到查询词之后,对查询词进行地址级别标注得到地址级别片段,按照地址级别片段的行政区划级别由高到低的顺序\n对地址级别片段进行排序,得到修正后的查询词,由于修正后的查询词中的地址级别片段\n按照行政区划级别从高到低的顺序依次排序,使得修正后的查询词描述的更为准确、清楚,更符合用户的真实查询意图,因此根据修正后的查询词进行地理编码所得到的地理范围更\n准确;另一方面,由于对查询词进行地理编码时可能会存在对查询词做过度解析,因此在根据修正后的查询词进行地理编码之后,将地理编码信息中的行政地址级别信息与所述排序\n后的地址级别片段进行比较,根据比较结果对所述地理编码信息中的地理范围进行修正,\n使得修正后的地理范围更符合用户实际所要搜索的地理范围,因此,根据修正后的查询词\n在修正后的地理范围内进行兴趣点搜索所得到结果更准确,提高了兴趣点搜索的准确性。\n附图说明\n[0037] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现\n有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本\n发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。\n[0038] 图1是本发明实施例提供的一种兴趣点搜索方法的流程图之一;\n[0039] 图2是本发明实施例中对地理范围进行修正的方法流程图;\n[0040] 图3是本发明实施例提供的一种兴趣点搜索方法的流程图之二的部分流程图;\n[0041] 图4是本发明实施例列举的具体实例的详细流程图;\n[0042] 图5是本发明实施例提供的兴趣点搜索装置的结构示意图。\n具体实施方式\n[0043] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完\n整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他\n实施例,都属于本发明保护的范围。\n[0044] 本发明实施例提供一种兴趣点搜索方法,该方法包括:\n[0045] 步骤101,接收用户输入的查询词。\n[0046] 具体地,当用户通过客户端登录到信息搜索服务器时,在客户端上展示搜索界面,用户可通过在搜索界面上相应的搜索框中输入想要查询的查询词。\n[0047] 步骤102,对所述查询词进行地址级别标注,得到组成所述查询词的地址级别片\n段。\n[0048] 具体地,可通过信息搜索服务器中的地址级别标注系统对查询词进行地址级别标\n识,以得到地址级别片段。其中,地址级别系统主要是通过对特殊地理字词的识别和国家行政区划词表的匹配,对查询词进行解析并切分成地址级别片段,并对该地址级别片段进行\n级别标注,使得每个地址级别片段为一个最小的地址级别片段单元。地址级别标注系统对\n于不同的地址级别片段分成18个类别,该18个类别不存在严格的从属关系,如河湖[oj]与\n大厦[od]属于平等关系而没有从属关系,因此,18个类别之间仅存在6个类别之间存在从属关系,该6个类别按照级别从高到低的顺序进行排序如下:国家级、省级、市级、区县级、村镇级以及POI。例如:查询词为“广州荔湾区光复中路313号国际眼镜贸易中心”,通过地址级别标注系统对该查询词进行标注的结果为:广州[oc],荔湾区[oc],光复中路[ol],313号\n[oh],国际眼镜贸易中心[op]。\n[0049] 步骤103,按照地址级别片段的行政区划级别由高到低的顺序,对组成所述查询词\n的地址级别片段进行排序,将地址级别片段按排序后的顺序进行组合,得到修正后的查询\n词。\n[0050] 步骤104、确定用户的预设城市代码,并根据排序后的地址级别片段的行政区划级\n别和预设的城市代码所对应的城市的行政区划级别,对所述预设的城市代码进行修正,得\n到修正后的城市代码。\n[0051] 本发明实施例中,对于PC用户,一打开电子地图会有默认的城市代码(如北京的\n010),当用户选择城市之后会对这个默认的城市代码进行修改,修改后的城市代码为预设城市代码,若用户没有选择城市则默认的城市代码即为预设的城市代码。对于手机用户,一打开电子地图会对用户当前位置进行定位,会将这个用户当前所在市的城市代码作为预设\n城市代码。\n[0052] 步骤105、根据修正后的查询词和修正后的城市代码进行地理编码,得到对应的地\n理编码信息,所述地理编码信息包括行政地址级别信息和地理范围。\n[0053] 例如:修正后的查询词为“广州荔湾区光复中路313号国际眼镜贸易中心”,则对该修正后的查询词进行地理编码,得到的地理编码信息,地理编码信息中的“广东省”、“广州市”、“荔湾区”和“光复中路313号”为行政地址级别信息,经度:113.251180、纬度:\n23.118909,范围:28m为地理范围,地理编码信息为:\n[0054] 省份:广东省;\n[0055] 城市:广州市;\n[0056] 区县:荔湾区;\n[0057] 地址:光复中路313号;\n[0058] 城市代码:440103;\n[0059] 地址串前的非地址串:空;\n[0060] 地址串后的非地址串:国际眼镜贸易中心;\n[0061] 地址串识别出的最小级别:门牌号;\n[0062] 经度:113.251180;\n[0063] 纬度:23.118909;\n[0064] 范围:28m;\n[0065] 地理编码识别可靠度:0.705882。\n[0066] 步骤106、将所述行政地址级别信息与所述排序后的地址级别片段进行比较,根据\n比较结果对所述地理范围进行修正,得到修正后的地理范围。\n[0067] 步骤107、根据修正后的查询词,在修正后的地理范围内进行兴趣点搜索,得到搜\n索结果。\n[0068] 前述步骤103中,可通过以下方式实现:\n[0069] 当组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别\n比第N-1个地址级别片段的行政区划级别高,且,所述第N个地址级别片段带有行政区划后\n缀,则交换第N-1个和第N个地址级别片段的位置;\n[0070] 和/或,\n[0071] 当组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别\n比第N-1个地址级别片段的行政区划级别高,且所述第N个地址级别片段不带行政区划后缀\n但其是组成所述查询词的最后一个地址级别片段,则交换第N-1个和第N个地址级别片段的\n位置,并在第N个地址级别片段中添加与该第N个地址级别片段的行政区划级别相对应的行\n政区划后缀。\n[0072] 例如:假设步骤102中得到的地址级别片段为“昌平;北京市;电影院”,由于第2个地址级别片段“北京市”的行政区划级别为市级,第1个地址级别片段“昌平”的行政区划级别为区县级,由于排在后面的地址级别片段“北京市”比排在前面地址级别片段“昌平”的行政区划级别高,且“北京市”带有行政区划后缀“市”,因此交换第1个地址级别片段与第2个地址级别片段的位置之后,得到排序后的地址级别片段为“北京市;昌平区;电影院”。还例如步骤102的地址级别片段为“北京市;电影院;昌平”,由于第2个地址级别片段“电影院”的行政区划级别低于地址级别片段“昌平”,且“昌平”不带行政区划后缀且其是组成所述查询词的最后一个地址级别片段,因此交换第2个地址级别片段和第3个地址级别片段,并在排\n序后的第2个地址级别片段后面添加相应的行政区划后缀“市”,则得到排序后的地址级别片段为“北京市;昌平区;电影院”。\n[0073] 前述步骤104中,根据排序后的地址级别片段的行政区划级别和预设城市代码所\n对应的城市的行政区划级别,对所述预设的城市代码进行修正,得到修正后的城市代码,可通过以下方式实现:\n[0074] 如果排序后的地址级别片段中行政区划级别最大的地址级别片段存在多个,则确\n定出该多个地址级别片段中带有行政区划后缀的地址级别片段,并将排在最前面的带有行\n政区划后缀的地址级别片段所对应的城市代码替换预设的城市代码;\n[0075] 和/或,\n[0076] 如果排序后的地址级别片段中存在行政区划级别比预设的城市代码所对应的城\n市的行政区划级别高的地址级别片段时,或者,修正后的地址级别片段中存在与所述预设\n的城市代码所对应的城市的行政区划级别相同的地址级别片段时,则:若该地址级别片段\n带有行政区划后缀,或者该地址级别片段不带行政区划后缀但其是组成所述查询词的最后\n一个地址级别片段,则将该地址级别片段对应的行政区划的城市代码替换所述预设的城市\n代码。\n[0077] 例如:步骤103中的地址级别片段为:“南京”;“北京市”;“大饭店”,由于第1个地址级别片段“南京”的行政区划级别与第2个地址级别片段“北京市”的行政区划级别相同均为市级,即行政级区划级别最高的地址级别片段有两个,则将第一个带有行政区划后缀的“北京市”的城市代码010替换预设的城市代码。还例如:步骤103中的地址级别片段为:“上海市”、“大厦”,预设的城市代码为010,则由于地址级别片段“上海市”的行政区划级别与该城市代码对应的城市的行政区划级别相同,且该地址级别片段带有行政区划后缀,因此将该\n地址级别片段“上海市”对应的城市代码021替换所述预设城市代码010。\n[0078] 优选地,本发明实施例中,为避免由于过渡解析查询词导致搜索结果不准确的问\n题,针对非地址串是一个可修饰类别词,则说明之前的地理编码进行了过度解析,如将原本不应该当成行政区划的字段解析成了行政区划,比如“上海华亭宾馆”中的“华亭”解析成了“华亭镇”;将“北京海淀医院”中的“海淀”解析成了“海淀区”,而事实上“华亭”和“海淀”在文中均属于修饰词,因此,针对该种情况,本发明实施例在所述非地址串的前一个地址级别片段不带行政区划后缀,将所述非地址串与其前一个地址级别片段进行合并,得到新的非\n地址串。如查询词为“上海华亭宾馆”,地址级别标注结果为“上海;华亭;宾馆”,其中“宾馆”是非地址串,该非地址串的前一个地址级别片段“华亭”不带行政区划后缀,因此将非地址串“宾馆”与其前一个地址级别片段合并成新的非地址串为“华亭宾馆”,对排序后的地址级别片段中除所述新的非地址串的其他地址级别片段“上海”进行地理编码,得到新的地理编码信息,根据新的地理编码信息中的地理范围修正所述对修正后的查询词进行地理编码得\n到的地理编码信息中的地理范围。因此,前述步骤106中,将所述行政地址级别信息与所述排序后的地址级别片段进行比较,根据比较结果对所述地理范围进行修正,其具体实现可\n参见图2所示的方法流程,方法包括:\n[0079] 步骤1061、确定出排序后的地址级别片段中与地理编码信息中行政地址级别片段\n信息内容一致的地址级别片段,并将内容一致的地址级别片段中行政区划级别最低的地址\n级别片段的行政区划级别作为临界级别;\n[0080] 步骤1062、将排序后的地址级别片段中行政区划级别低于所述临界级别的地址级\n别片段合并为一个非地址串;\n[0081] 步骤1063、当所述非地址串不为门牌号,且为可修饰词时,则:若所述非地址串的前一个地址级别片段不带行政区划后缀,将所述非地址串与其前一个地址级别片段进行合\n并,得到新的非地址串;\n[0082] 步骤1064、对排序后的地址级别片段中除所述新的非地址串的其他地址级别片段\n进行地理编码,得到新的地理编码信息,根据新的地理编码信息中的地理范围修正所述对\n修正后的查询词进行地理编码得到的地理编码信息中的地理范围。\n[0083] 例如:地理编码信息中的行政区划级别信息为“广东省”、“广州市”、“荔湾区”、“解放7路广东国际眼镜贸易中心”,排序后的地址级别片段为“广东省”、“广州市”、“荔湾区”、“解放”、“7路”、“广东国际眼镜贸易中心”,对比两者内容一致地址级别片段为“广东省”“广州市”“荔湾区”,其中“荔湾区”的行政区划级别最低,为临界级别。其他的地址级别片段的行政区划级别低于临界级别,因此将其他的地址级别片段合并成“解放路7号广东国际眼镜贸易中心”,该“解放路7号广东国际眼镜贸易中心”为非地址串。\n[0084] 例如,修正后的查询词为“上海市华亭宾馆”,对该“上海市华亭宾馆”进行地理编码,得到的地理编码信息为:\n[0085] a)省份:上海市\n[0086] b)城市:\n[0087] c)区县:嘉定区\n[0088] d)地址:华亭镇\n[0089] e)城市代码:310114\n[0090] f)地址串前的非地址串:\n[0091] g)地址串后的非地址串:宾馆\n[0092] h)地址串识别出的最小级别:城镇级\n[0093] i)经度:121.284212\n[0094] j)纬度:31.469376\n[0095] k)范围:2432m\n[0096] l)地理编码识别可靠度:0.827586\n[0097] 将地理编码信息中的行政地址级别信息“上海市”、“嘉定区”、“华亭镇”与排序后的地址级别片段“上海市”、“华亭宾馆”进行比较可知,两者的临界级别为市级,“华亭宾馆”为非地址串,该非地址串的前一个地址级别片段带有行政区划后缀,不需要对该非地址串\n进行处理,因此,对除非地址级别片段的其他地址级别片段“上海市”进行地理编码,得到新的地理编码信息如下:\n[0098] a)省份:上海市\n[0099] b)城市:\n[0100] c)区县:\n[0101] d)地址:\n[0102] e)城市代码:310000\n[0103] f)地址串前的非地址串:\n[0104] g)地址串后的非地址串:\n[0105] h)地址串识别出的最小级别:省级\n[0106] i)经度:121.472644\n[0107] j)纬度:31.231706\n[0108] k)范围:76471m\n[0109] l)地理编码识别可靠度:1.00000。\n[0110] 再根据新的地理编码信息对原地理编码信息中的地理范围进行修正。\n[0111] 优选地,当非地址串是一个数字+量词的门牌号字段时,本发明实施例则可以直接\n删除该非地址串,并将删除后非地址串的查询词进行地理编码,如“北京市海淀区北四环西路105号”,这里的非地址串为“105号”,可以直接去除“105号”,对“北京市海淀区北四环西路”进行地理编码。\n[0112] 优选地,本发明实施例中,前述步骤107中,根据修正后的查询词,在修正后的地理编码信息中的地理范围内进行兴趣点搜索,具体包括:将所述修正后的查询词作为关键词,在修正后的地理范围内进行兴趣点搜索;若有结果,则将该结果确定为搜索结果;若无结\n果,则对所述修正后的查询词进行切分,得到组成所述查询词的分词,并根据组成所述查询词的分词在所述修正后的地理范围内进行兴趣点搜索。\n[0113] 优选地,为快速、有效的完成兴趣点搜索,本发明实施例中,在对修正后的查询词进行切分得到多个分词时,对该多个分词赋予相同的权重;再依次判断各分词是否为地址\n名词,若是则降低该分词的权重,若不是则增加所述分词的权重;最后再根据权重大于预设权重阈值的分词在所述修正后的地理范围内进行兴趣点搜索。如:将切分后得到的分词的\n权重设置为100%;如果地理编码结果中包含该分词则说明该分词为地址名词,则将其权重\n降为50%,若地址编码结果中不包含该分词则说明该分词不是地址名词,则将该分词的权重上升为150%;比如分词结果为“广东省”、“广州市”、“荔湾区”、“光复中路”、“313号”、“广东”、“国际”、“眼镜”、“贸易”、“中心”,地理编码结果中包括“广东省”、“广州市”、“荔湾区”,则该三个分词“广东省”、“广州市”、“荔湾区”的权重降为50%,其余分词的权重设置为150%。\n[0114] 优选地,为提高用于搜索的分词的准确性和提高搜索结果的全面性,本发明实施\n例,在确定出权重值大于权重阈值的分词之后,从预设的同义词列表中获取该分词的同义\n词,如权重值大于权重阈值的分词为“酒店”,则获取其同义词为“酒楼”、“宾馆”等,并在以“酒店”为关键词进行搜索之后,还以其同义词“酒楼”、“宾馆”进行搜索。\n[0115] 优选地,为进一步确保查询词的准确性,本发明实施例,还可以在图1所示的方法\n流程中的步骤101与步骤102之间还包括以下步骤101A~步骤101D,如图3所示:\n[0116] 步骤101A、判断所述查询词是否包含预置的特殊词,若包含则执行步骤101B,若否则执行步骤101C。\n[0117] 步骤101B、将该特殊词按照预置的转换规则,转换成与该特殊词对应的常规词。\n[0118] 如特殊词为“市区”,则预置的转换规则为将该“市区”替换为当前所在城市的名称;还如:特殊词为POI的简称,则预置的转换规则为将该简称替换成相应POI的全称,如特殊词为“北大”,则需要将该“北大”替换为北京大学。\n[0119] 步骤101C、判断所述查询词是否为预置的特定名词,若是则执行步骤101D,若否则执行步骤102。\n[0120] 步骤101D、以该特定名词为关键词进行兴趣点搜索。\n[0121] 本发明实施例中,特定名词为与城市结合紧密的名词,其一般代表一个实际存在\n的地址,如“天安门”、“南京火车站”等。\n[0122] 为更清楚、详细的描述本发明技术方案,下面以一具体实例,对本发明技术方案进行描述,该实例中,在预设城市代码为010(北京)查询“华亭宾馆上海市”,采用本发明技术方案的方法流程如图4所示:\n[0123] 步骤401、接收查询词“华亭宾馆上海市”;\n[0124] 步骤402、判断该查询词不包含特殊词,且该查询词不包含特定名词。\n[0125] 步骤403、对查询词进行地址级别标注,得到地址级别片段为“华亭”、“宾馆”、“上海市”;\n[0126] 步骤404、判断第3个地址级别片段的行政区划级别高于第2个地址级别片段,调换\n第2个地址级别片段与第3个地址级别片段之间的位置;并判断调换后的第2个地址级别片\n段的行政区划级别高于第1个地址级别片段,因此调换第1个地址级别片段和第2个地址级\n别片段的位置,得到排序后的地址级别片段为“上海市”、“华亭”、“宾馆”,以及得到修正后的查询词为“上海市华亭宾馆”;\n[0127] 步骤405、确定地址级别片段“上海市”的行政区划级别与预设城市代码对应的城\n市的行政区划级别一致,且该地址级别片段带有行政区划后缀,因此将上海市对应的城市\n代码021替换预设的城市代码;\n[0128] 步骤406、根据修正后的城市代码021和修正后的查询词“上海市华亭宾馆”进行地理编码,得到对应的地理编码信息为:\n[0129] a)省份:上海市\n[0130] b)城市:\n[0131] c)区县:嘉定区\n[0132] d)地址:华亭镇\n[0133] e)城市代码:310114\n[0134] f)地址串前的非地址串:\n[0135] g)地址串后的非地址串:宾馆\n[0136] h)地址串识别出的最小级别:城镇级\n[0137] i)经度:121.284212\n[0138] j)纬度:31.469376\n[0139] k)范围:2432m\n[0140] l)地理编码识别可靠度:0.827586。\n[0141] 步骤407、将地理编码信息中的行政级别信息与所述排序后的地址级别片段进行\n比较,得到两者相同的地址级别片段为“上海市”,将“上海市”的行政区划级别市级作为临界级别;\n[0142] 步骤408、将低于临界级别的其他地址级别片段进行合并,得到非地址串“华亭宾\n馆”;\n[0143] 步骤409、对“上海市”进行地理编码,得到地理编码信息为:\n[0144] a)省份:上海市\n[0145] b)城市:\n[0146] c)区县:\n[0147] d)地址:\n[0148] e)城市代码:310000\n[0149] f)地址串前的非地址串:\n[0150] g)地址串后的非地址串:\n[0151] h)地址串识别出的最小级别:省级\n[0152] i)经度:121.472644\n[0153] j)纬度:31.231706\n[0154] k)范围:76471m\n[0155] l)地理编码识别可靠度:1.00000。\n[0156] 步骤410、根据步骤409的地理编码信息中的地理范围修正步骤408得到的地理编\n码信息中的地理范围。\n[0157] 步骤411、以“上海市华亭宾馆”为关键词,在在修正后的地理范围内进行兴趣点搜索,并搜索无结果;\n[0158] 步骤412、对“上海市华亭宾馆”进行切分,得到分词“上海市”、“华亭”、“宾馆”,且为该三个分词赋予初始权重为100%;\n[0159] 步骤413、判断分词“上海市”在地理编码信息中,将“上海市”的权重调整为50%,将分词“华亭”、“宾馆”的权重均调整为150%;\n[0160] 步骤414、根据权重值大于预设权重阈值100%的“华亭”、“宾馆”在修正后的地理范围内进行兴趣点搜索,以得到搜索结果。\n[0161] 本发明实施例还提供一种兴趣点搜索装置,该装置的结构如图5所示,包括:\n[0162] 查询词接收单元51,用于接收用户输入的查询词;\n[0163] 标注单元52,用于对所述查询词进行地址级别标注,得到组成所述查询词的地址\n级别片段;\n[0164] 排序单元53,用于按照地址级别片段的行政区划级别由高到低的顺序,对组成所\n述查询词的地址级别片段进行排序,将地址级别片段按排序后的顺序进行组合,得到修正\n后的查询词;\n[0165] 城市代码修正单元54,用于确定用户的预设城市代码,并根据排序后的地址级别\n片段的行政区划级别和预设的城市代码所对应的城市的行政区划级别,对所述预设的城市\n代码进行修正,得到修正后的城市代码;\n[0166] 地理编码单元55,用于根据修正后的查询词和修正后的城市代码进行地理编码,\n得到对应的地理编码信息,所述地理编码信息包括行政地址级别信息和地理范围;\n[0167] 地理范围修正单元56,用于将所述行政地址级别信息与所述排序后的地址级别片\n段进行比较,根据比较结果对所述地理范围进行修正,得到修正后的地理范围;\n[0168] 搜索单元57,用于根据修正后的查询词,在修正后的地理范围内进行兴趣点搜索,得到搜索结果。\n[0169] 优选地,前述排序单元53,具体用于:组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别比第N-1个地址级别片段的行政区划级别高,且,所述第N\n个地址级别片段带有行政区划后缀,则交换第N-1个和第N个地址级别片段的位置;和/或,组成所述查询词的地址级别片段中,如果第N个地址级别片段的行政区划级别比第N-1个地\n址级别片段的行政区划级别高,且所述第N个地址级别片段不带行政区划后缀但其是组成\n所述查询词的最后一个地址级别片段,则交换第N-1个和第N个地址级别片段的位置,并在\n第N个地址级别片段中添加与该第N个地址级别片段的行政区划级别相对应的行政区划后\n缀。\n[0170] 优选地,前述城市代码修正单元54,具体用于:如果排序后的地址级别片段中行政区划级别最大的地址级别片段存在多个,则确定出该多个地址级别片段中带有行政区划后\n缀的地址级别片段,并将排在最前面的带有行政区划后缀的地址级别片段所对应的城市代\n码替换预设的城市代码;和/或,如果排序后的地址级别片段中存在行政区划级别比预设的城市代码所对应的城市的行政区划级别高的地址级别片段时,或者,修正后的地址级别片\n段中存在与所述预设的城市代码所对应的城市的行政区划级别相同的地址级别片段时,\n则:若该地址级别片段带有行政区划后缀,或者该地址级别片段不带行政区划后缀但其是\n组成所述查询词的最后一个地址级别片段,则将该地址级别片段对应的行政区划的城市代\n码替换所述预设的城市代码。\n[0171] 优选地,所述地理范围修正单元56,具体用于:确定出排序后的地址级别片段中与地理编码信息中行政地址级别片段信息内容一致的地址级别片段,并将内容一致的地址级\n别片段中行政区划级别最低的地址级别片段的行政区划级别作为临界级别;将排序后的地\n址级别片段中行政区划级别低于所述临界级别的地址级别片段合并为一个非地址串;当所\n述非地址串不为门牌号,且为可修饰词时,则:若所述非地址串的前一个地址级别片段不带行政区划后缀,将所述非地址串与其前一个地址级别片段进行合并,得到新的非地址串;对排序后的地址级别片段中除所述新的非地址串的其他地址级别片段进行地理编码,得到新\n的地理编码信息,根据新的地理编码信息中的地理范围修正所述对修正后的查询词进行地\n理编码得到的地理编码信息中的地理范围。\n[0172] 优选地,所述搜索单元57,具体用于:将所述修正后的查询词作为关键词,在修正后的地理范围内进行兴趣点搜索;若有结果,则将该结果确定为搜索结果;若无结果,则对所述修正后的查询词进行切分,得到组成所述查询词的分词,并根据组成所述查询词的分\n词在所述修正后的地理范围内进行兴趣点搜索。\n[0173] 本发明实施例提供的兴趣点搜索方法中,一方面,在接收到查询词之后,对查询词进行地址级别标注得到地址级别片段,按照地址级别片段的行政区划级别由高到低的顺序\n对地址级别片段进行排序,得到修正后的查询词,由于修正后的查询词中的地址级别片段\n按照行政区划级别从高到低的顺序依次排序,使得修正后的查询词描述的更为准确、清楚,更符合用户的真实查询意图,因此根据修正后的查询词进行地理编码所得到的地理范围更\n准确;另一方面,由于对查询词进行地理编码时可能会存在对查询词做过度解析,因此在根据修正后的查询词进行地理编码之后,将地理编码信息中的行政地址级别信息与所述排序\n后的地址级别片段进行比较,根据比较结果对所述地理编码信息中的地理范围进行修正,\n使得修正后的地理范围更符合用户实际所要搜索的地理范围,因此,根据修正后的查询词\n在修正后的地理范围内进行兴趣点搜索所得到结果更准确,提高了兴趣点搜索的准确性。\n[0174] 本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可\n以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储\n介质可以包括:只读存储器(ROM)、随机存取存储器(RAM)、磁盘或光盘等。\n[0175] 以上对本发明实施例所提供的兴趣点搜索方法和设装置进行了详细介绍,本文中\n应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助\n理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本\n发明的限制。
法律信息
- 2020-06-02
专利权的转移
登记生效日: 2020.05.13
专利权人由高德软件有限公司变更为阿里巴巴(中国)有限公司
地址由102200 北京市昌平区科技园区昌盛路8号B1座1-5层变更为310052 浙江省杭州市滨江区长河街道网商路699号4号楼5楼508室
- 2019-02-12
- 2015-07-01
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201310651478.6
申请日: 2013.12.03
- 2015-06-03
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2011-12-28
|
2010-06-24
| | |
2
| |
2009-01-21
|
2007-07-18
| | |
3
| |
2010-11-10
|
2010-06-30
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |