加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

搜索引擎中包含WEB对象的聚类方法

发明专利无效专利
  • 申请号:
    CN200910152879.0
  • IPC分类号:G06F17/30
  • 申请日期:
    2009-09-18
  • 申请人:
    浙江大学
著录项信息
专利名称搜索引擎中包含WEB对象的聚类方法
申请号CN200910152879.0申请日期2009-09-18
法律状态撤回申报国家中国
公开/公告日2010-05-12公开/公告号CN101706790A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人浙江大学申请人地址
浙江省杭州市西湖区浙大路38号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人浙江大学当前权利人浙江大学
发明人陈珂;陈刚;寿黎但;胡天磊;盛振华
代理机构杭州求是专利事务所有限公司代理人林怀禹
摘要
本发明公开了一种搜索引擎中包含WEB对象的聚类方法。通过挖掘词汇间的树状概率层次关系,计算词汇在数据集中的信息分布集中度,作为分辨对象的标志。该方法建立一个新型的信息传递有向无环图模型,准确提取数据中对辨别对象起到关键作用的特征词汇,提高相似度计算的精确性,并且建立一种新型的自适应记录合并模型,有效地提高各个记录簇中记录间高相似度比例,减少噪音对合并过程的影响,具有很高的准确性,健壮性和通用性。本发明充分利用了垂直搜索引擎环境中检索系统的现有研究和实现成果,可以方便快捷的提高WEB对象的聚类结果细粒度,并且不依赖于一种特有的文本检索技术,使用者根据应用需求选择最合适的聚类合并技术,提供最好的性能。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供