著录项信息
专利名称 | 信息检索装置 |
申请号 | CN200710151568.3 | 申请日期 | 2007-09-28 |
法律状态 | 暂无 | 申报国家 | 中国 |
公开/公告日 | 2008-04-30 | 公开/公告号 | CN101169327 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G01C21/26 | IPC分类号 | G;0;1;C;2;1;/;2;6;;;G;0;1;C;2;1;/;3;4;;;G;0;1;C;2;1;/;3;6查看分类表>
|
申请人 | 高德软件有限公司 | 申请人地址 | 浙江省杭州市滨江区长河街道网商路699号4号楼5楼508室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 阿里巴巴(中国)有限公司 | 当前权利人 | 阿里巴巴(中国)有限公司 |
发明人 | 姜德荣;孙竹平 |
代理机构 | 中国商标专利事务所有限公司 | 代理人 | 张晓冬 |
摘要
本发明公开一种信息检索装置包括输入单元,用于接收检索词;分词单元,用于对所述输入单元接收的检索词进行分词处理以获得若干词元;匹配单元,用于在导航电子地图数据库中找出所述检索词或者所述词元匹配的字段;主照片配置单元,用于将兴趣点的主照片存入导航电子地图数据库中;显示单元,用于显示与所述匹配单元找出的字段相关的信息和其主照片。由于本发明采用了主照片配置单元将兴趣点的主照片存入导航电子地图数据库中,在将查询结果显示出来的时候同时也将其相应的主照片显示出来,从而能够展示兴趣点等待查询信息的实际形象。
1.一种电子导航系统的信息检索装置,其特征在于,包括:
输入单元,用于接收检索词;
分词单元,用于对所述输入单元接收的检索词进行分词处理以获得若干词元;
匹配单元,用于在导航电子地图数据库中找出所述检索词或者所述词元匹配的字段;
主照片配置单元,用于将兴趣点的主照片存入导航电子地图数据库中;
显示单元,用于显示与所述匹配单元找出的字段相关的信息和其主照片;
所述分词单元进一步包括:
词汇判断单元,在按照行业种类建立的类别表中查找所述检索词的最后两个字,如果找到,则将所述检索词划分为可分类词汇,如果没有找到,则将所述检索词划分为一般词汇;
查找单元,若检索词为可分类词汇,则在可分类词汇其类型名称对应的词库的索引区域的指针集合中查找检索词,若为一般词汇,则在整个词库中查找检索词;
第一判断单元,用于判断所述查找单元是否找到所述检索词;
检索词处理单元,若从所述第一判断单元接收的信息为“否”,则减小所述检索词的长度,并将减小长度后的检索词送给所述查找单元;
存放单元,用于存放所述检索词处理单元截取掉的字符和将查找到的检索词作为一个词元存储;
第二判断单元,判断所述存放单元中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元,否则将词元输出。
2.如权利要求1所述的信息检索装置,其特征在于,所述显示单元进一步包括:
排序单元,用于按照匹配度的高低对所述匹配单元检索出的字段进行排序;
相关显示单元,用于按照排序单元所排的顺序显示与所述字段相关的信息。
信息检索装置 \n技术领域\n[0001] 本发明涉及电子导航领域,尤指一种信息检索装置。 \n[0002] 背景技术\n[0003] 现有的车载卫星导航系统的信息检索装置普遍者提供了兴趣点信息的查询检索功能,利用该功能,用户可以方便的在查询界面输入自己想要查询的信息内容,系统会自动查询输出查询结果,以满足用户的需求。目前提供的兴趣点的详细信息主要有名称、地址、电话、传真、邮编等属性信息,用户查询检索到后,可以看到这些信息的详细文字记录即都是文字性抽象的记录,但用户并不能了解该兴趣点的实际外观形象。 \n[0004] 发明内容\n[0005] 本发明要解决的问题是提供一种展示实际外观形象的信息检索装置。 [0006] 为了解决上述问题,本发明信息检索装置包括: \n[0007] 输入单元,用于接收检索词; \n[0008] 分词单元,用于对所述输入单元接收的检索词进行分词处理以获得若干词元; [0009] 匹配单元,用于在导航电子地图数据库中找出所述检索词或者所述词元匹配的字段; \n[0010] 主照片配置单元,用于将兴趣点的主照片存入导航电子地图数据库中; [0011] 显示单元,用于显示与所述匹配单元找出的字段相关的信息和其主照片; [0012] 所述分词单元进一步包括: \n[0013] 词汇判断单元,在按照行业种类建立的类别表中查找所述检索词的最后两个字,如果找到,则将所述检索词划分为可分类词汇,如果没有找到,则将所述检索词划分为一般词汇; \n[0014] 查找单元,若检索词为可分类词汇,则在可分类词汇其类型名称对应的词库的索引区域的指针集合中查找检索词,若为一般词汇,则在整个词库中查找检索词; [0015] 第一判断单元,用于判断所述查找单元是否找到所述检索词; \n[0016] 检索词处理单元,若从所述第一判断单元接收的信息为“否”,则减小所述检索词的长度,并将减小长度后的检索词送给所述查找单元; \n[0017] 存放单元,用于存放所述检索词处理单元截取掉的字符和将查找到的检索词作为一个词元存储; \n[0018] 第二判断单元,判断所述存放单元中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元,否则将词元输出。 \n[0019] 所述显示单元进一步包括: \n[0020] 排序单元,用于按照匹配度的高低对所述匹配单元检索出的字段进行排序; [0021] 相关显示单元,用于按照排序单元所排的顺序显示与所述字段相关的信息。 [0022] 与现有技术相比,本发明信息检索装置的有益效果为: \n[0023] 由于本发明采用了主照片配置单元104将兴趣点的主照片存入导航电子地图数据库中,在将查询结果显示出来的时候同时也将其相应的主照片显示出来,从而能够展示兴趣点等待查询信息的实际形象。 \n附图说明\n[0024] 图1是本发明电子导航系统的信息检索装置的结构图; \n[0025] 图2是图1中的分词单元的结构示意图; \n[0026] 图3是词库结构示意图; \n[0027] 图4是词库的举例示意图。 \n具体实施方式\n[0028] 如图1所示,本发明电子导航系统的信息检索装置包括: \n[0029] 输入单元100,用于接收检索词; \n[0030] 分词单元101,用于对所述检索词进行分类并进行分词处理以获得若干词元;匹配单元102,用于在数据库中找出与所述词元匹配的字段; \n[0031] 主照片配置单元104,用于将兴趣点的主照片存入导航电子地图数据库中; [0032] 显示单元103,用于显示与所述匹配单元102找出的字段相关的信息和其主照片。 [0033] 由上述可知,主照片配置单元104将兴趣点的主照片存入导航电子地图数据库中,输入单元100将接收到的检索词送给分词单元101,分词单元101将检索词处理后得到若干词元,匹配单元102在导航电子地图数据库中查找与这些词元匹配的信息,显示单元\n103在将这些匹配的信息的时候同时也将其主照片从导航电子地图数据库中取出并显示出来,从而能够展示兴趣点的实际形象。 \n[0034] POI主照片数据表Poiphoto结构如表1所示: \n[0035] \n Index Name Description \n 1 ID 索引号 \n 2 NAME POI名称 \n 3 ADDRESS POI地址 \n 4 PHONE POI联系电话 \n 5 PHOTO_CODE POI主照片编号 \n[0036] 表1 \n[0037] POI主照片数据表Poiphoto内容举例如表2: \n[0038] \n[0039] 表2 \n[0040] 所述分词单元101进一步包括: \n[0041] 词汇判断单元1015,判断检索词是否为可分类词汇; \n[0042] 查找单元1010,对于可分类词汇,在指针集合中查找检索词;对于一般词汇,在整个词库集合中查找检索词; \n[0043] 第一判断单元1011,用于判断所述查找单元1010是否找到所述检索词; [0044] 检索词处理单元1012,若从所述第一判断单元1011接收的信息为“否”,则减小所述检索词的长度,并将减小长度后的检索词送给所述查找单元1010; \n[0045] 存放单元1013,用于存放所述检索词处理单元1012截取掉的字符和将查找到的检索词作为一个词元存储; \n[0046] 第二判断单元1014,判断所述存放单元1013中是否还有未分词的部分,若还有则将未分词的部分送给所述查找单元1010,否则将词元输出。 \n[0047] 所述显示单元103进一步包括: \n[0048] 排序单元1030,用于按照匹配度的高低对所述匹配单元102检索出的字段进行排序; \n[0049] 相关显示单元1031,用于按照排序单元所排的顺序显示与所述字段相关的信息。 [0050] 其中,实现词汇判断单元1015的伪代码为: \n[0051] String key=“检索词”; \n[0052] Int length=key.length(); //得到检索词的字符串长度 \n[0053] String type=key.subString(length-2); //取得检索词的最后两个字 \n[0054] Dictionary dic=new Dictionary(″SDIC.txt″);//加载类别表 \n[0055] HashMap hm=new HashMap() \n[0056] while((s=in.readLine())!=null) \n[0057] { \n[0058] words=s.split(″\t″); \n[0059] Integer freq=new Integer(words[1]); \n[0060] hm.put(words[0],freq); //存入类别名称 [0061] } \n[0062] boolean bfind=hm.containsKey(type); //是否找到类别名称 [0063] 实现查找单元1010的伪代码为: \n[0064] String key=“检索词”; \n[0065] Set resultset=“得到的检索集合”; //若为可分类词汇,则此集合为该类别的指针集合,若为一般词汇,则此集合指整个词库中的内容 \n[0066] boolean bool=resultset.containsKey(key); //判断检索词是否在检索集合中 \n[0067] 实现检索词处理单元1012的伪代码为: \n[0068] String key=“检索词”; \n[0069] If(没有找到检索词){ \n[0070] key=原检索词长度减小1后的结果; \n[0071] 执行1010单元; \n[0072] } \n[0073] 现假设用户输入的检索词是“中国人民银行”实现排序单元1030的伪代码为: [0074] int num=用户输入的检索词经过分词后得到的词元个数; \n[0075] int[]length=每个词元的字符串长度; \n[0076] int len=搜索出的每个记录的名字长度; \n[0077] if(num=1){//分词结果为该词本身 \n[0078] len与length比较。len越大,结果越靠后; \n[0079] //实现:“中国人民银行”排在“中国人民银行昌平分行”前面的功能 [0080] } \n[0081] else{ \n[0082] num越大,表示该记录包含的词元数量越多,结果应靠前显示。 \n[0083] 当num一样时,则比较记录的长度,长度小的靠前显示; \n[0084] //实现“中国人民银行昌平分行”排在“中国人民银行建设路分行”前面的功能 \n[0085] } \n[0086] 其中,所述可分类词汇指可划分到某个行业种类里面的词汇。例如:检索词为“王府饭店”,则这个检索词就为可分类词汇,其类型名称为:饭店。 \n[0087] 导航信息检索的特点之一为,用户检索的内容95%以上为各种地点的名称,而中文短句的中心词通常是最后两个字,例如:××饭店,××宾馆,利用这个特点,首先在词库中建立一个类别表,里面存放“饭店”,“宾馆”,“超市”等类型名称。进行类型判断时首先取出检索词的最后两个字,在类别表中查找,如果找到,则该检索词属于可分类词汇,类型名称为检索词的最后两个字。 \n[0088] 传统的词库都是按照词元的汉语拼音字母的顺序进行排序,本系统的词库采用类别和字母顺序相结合的方式进行词元的排序。对于可分类词汇,每个类别内部以及各个类别之间的词元采用汉语拼音字母的顺序进行排序,并且分布在词库中词元列表的前面,减少可分类词汇的检索时间;对于一般词汇,则只按照词元的汉语拼音字母的顺序进行排序,并且分布在可分类词汇的后面。 \n[0089] 词库中内容的片断截取如下: \n[0090] 银行 14_1 (可分类词汇) \n[0091] 中国工商 14_1_1 \n[0092] 中国建设 14_1_2 \n[0093] 中国农业 14_1_3 \n[0094] …….. \n[0095] 癌23_1 (一般词汇) \n[0096] 癌细胞 23_2 \n[0097] 癌症 23_3 \n[0098] 癌肿 23_4 \n[0099] 矮 23_5 \n[0100] 矮矮 23_6 \n[0101] 矮秆作物 23_7 \n[0102] 类别表主要负责记录各种类别及其索引编号,以供查找。类别表的结构大体与词库相似,但内容要少很多,所以查询类别表花费的时间很少,基本可以忽略。 [0103] 类别表内容的片断截取如下: \n[0104] 商场 10_1 \n[0105] 超市 10_2 \n[0106] 专卖店 10_3 \n[0107] 如图3所示,词汇分类时采用从大类到小类的方式进行分类,也方便进行词库的管理。根据日常生活的特点,首先确定几个大的类别,为每一个大类确定一个索引前缀,目的是唯一标识此大类,以便添加更小的类别(如:娱乐休闲,索引前缀为11);然后对此大类进行进一步细分,划分出更加详细的小类别,并且在大类索引前缀的后面添加类别编号,完成此小类的索引前缀(如:酒吧,索引前缀为11_2)。 \n[0108] 对于词库,以“银行”为例,它属于一个小类别,对应的大类为“金融机构”,其索引前缀为“14”,“银行”在大类中的编号是“1”,这样,就可以确定“银行”这一小类别的索引前缀为“14_1”。然后为“银行”这一类别中添加具体内容和索引指针, \n[0109] 例如: \n[0110] (名称) (指针/指针集合) \n[0111] 银行 14_1,14_1_1,14_1_2,14_1_3... \n[0112] 中国工商 14_1_1 \n[0113] 中国建设 14_1_2 \n[0114] 中国农业 14_1_3 \n[0115] 例如:用户开始输入的检索词为“北京威帝科技大厦”,进入分词单元,首先进行检索词的类型判定,经过分析判定为建筑物(索引前缀20,如图3和4所示)-大 厦(索引前缀20_13,如图3和4所示),在词库中查找数据区域为“大厦”的词元,得到该索引区域的指针集合。在指针集合中查找“北京威帝科技”,集合中如果没有找到这个词,则字符串长度减小一个字,变成“北京威帝科”,再去集合中查找,如果没有,再减小一个,变成“北京威帝”,这次如果在词库中找到了这个词,则“北京威帝”是分词结果的一部分;现在用户输入的检索词经过分词只剩下了“科技”,将“科技”这个词继续在指针集合中查找,如找到,则最终将用户输入的检索词分词为:“北京威帝”,“科技”,“大厦”,若在指针集合中无法找到与“北京威帝科技”相关的内容,则将“北京威帝科技大厦”作为一般词汇,进行词库查找。分词成功后,在导航电子地图数据库中查找出所有包含“北京威帝”,“科技”,“大厦”三个关键字的记录,并按照与用户输入的检索词“北京威帝科技大厦”的匹配度高低进行排序,然后把结果显示给用户。 \n[0116] 例如在导航电子地图数据库中检索有关“中国人民银行”的信息,输入单元100接收检索词“中国人民银行”后,首先对检索词进行分类,分类结果为:金融场所(索引前缀\n15)-银行(索引前缀15_14),将分类结果送给查找单元1010,查找单元1010取得“银行”的索引区域的指针集合,并在指针集合中查找是否存在该词,如果某个指针对应的数据区域内容刚好是“中国人民”则分词结束;如果所有指针对应的数据区域内容都不满足“中国人民”,则逐个减小“中国人民”字符串的长度,在指针集合中查找,如仍然没有找到,则将“中国人民银行”作为一般词汇进行检索,得到最终的分词结果。 \n[0117] 主照片配置单元104的实现如下: \n[0118] //在导航电子地图数据库中取得POI名称及其相关属性 \n[0119] public getResultSet(String poiname){ \n[0120] String sqlStr=“select*from iis“+ \n[0121] “where NAME=poiname”; \n[0122] ResultSet rs=stmt.executeQuerty(sqlStr); \n[0123] return rs; \n[0124] } \n[0125] //将poi的各种属性信息包括主照片信息导入到POI主照片数据表Poiphoto中 [0126] public void addpoi(ResuleSet rs){ \n[0127] String sql=″insert into Poiphoto(NAME,ADDRESS,PHONE,PHOTO_CODE) [0128] values( +rs.getString(1)+ re.getString(2)+ +rs.\ngetString(3)+ + \n[0129] rs.getString(4))″; \n[0130] stmt.executeUpdate(sql); \n[0131] } \n[0132] 例如,用户检索的是万寿宾馆,输入单元100接收到这个词,经过分词单元101处理后得到与万寿宾馆相匹配的结果集合,显示单元对结果集合进行排序处理,用户看到的地图界面的中心点为“万寿宾馆”这个poi点以及它的主照片信息。 \n[0133] 综上所述,由于本发明采用了主照片配置单元104将兴趣点的主照片存入导航电子地图数据库中,在将查询结果显示出来的时候同时也将其相应的主照片显示出来,从而能够展示兴趣点等待查询信息的实际形象。
法律信息
- 2020-06-16
专利权的转移
登记生效日: 2020.05.28
专利权人由高德软件有限公司变更为阿里巴巴(中国)有限公司
地址由102200 北京市昌平区科技园区昌盛路18号B1座变更为310052 浙江省杭州市滨江区长河街道网商路699号4号楼5楼508室
- 2011-02-09
- 2009-12-02
- 2008-04-30
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2002-02-13
|
2001-09-05
| | |
2
| |
2004-01-28
|
2002-07-25
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |