加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种挖掘查询语句子话题并聚类的信息搜索方法

发明专利有效专利
  • 申请号:
    CN201210004772.3
  • IPC分类号:G06F17/30
  • 申请日期:
    2012-01-09
  • 申请人:
    中国科学院软件研究所
著录项信息
专利名称一种挖掘查询语句子话题并聚类的信息搜索方法
申请号CN201210004772.3申请日期2012-01-09
法律状态授权申报国家中国
公开/公告日2012-04-18公开/公告号CN102419778A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人中国科学院软件研究所申请人地址
北京市海淀区中关村南四街4号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国科学院软件研究所当前权利人中国科学院软件研究所
发明人孙乐;江雪
代理机构北京君尚知识产权代理事务所(普通合伙)代理人余长江
摘要
本发明提供一种挖掘查询语句的子话题,并对子话题进行聚类的信息搜索方法。该方法将原始查询语句和历史查询语句分别分词,得到查询词序列,计算原查询语句与历史查询语句的相似度。进一步可将原查询通过语义词典进行扩展,计算扩展查询语句与历史查询语句的相似度,并修正历史查询语句与原始查询语句的相似度;还可通过历史查询语句的点击信息进一步修正历史查询语句与原始查询语句的相似度。然后通过相似度的预设阀值选出最终子话题,并对其进行聚类以及构建树形的层次结构。用户通过选择树形层次结构的不同叶子节点来获得不同分类粒度的检索结果,方便用户按照话题类别来浏览检索结果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供