加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种面向博客网页的网页检索系统及方法

发明专利无效专利
  • 申请号:
    CN201310141784.5
  • IPC分类号:G06F17/30
  • 申请日期:
    2013-04-22
  • 申请人:
    中山大学
著录项信息
专利名称一种面向博客网页的网页检索系统及方法
申请号CN201310141784.5申请日期2013-04-22
法律状态驳回申报国家中国
公开/公告日2013-07-24公开/公告号CN103218443A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人中山大学申请人地址
广东省广州市番禺区大学城中山大学东校区教学实验中心C401 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中山大学当前权利人中山大学
发明人罗笑南;曾金龙;林格
代理机构暂无代理人暂无
摘要
本发明实施例公开了一种面向博客网页的网页检索系统及方法,其中,该系统包括:信息提取模块,用于抓取与博客主题相关的网页;数据整理模块,用于对所述信息提取模块所抓取的初始的网页进行结构化信息提取和网页消重;索引模块,用于对所述数据整理模块所提取的数据建立索引;检索模块,用于提供用户检索接口,根据所述索引进行检索,并对检索的结果进行排序。在本发明实施例中,数据存储通过哈希映射取余的方法映射到多个服务器中,并且能够很好的保证各个存储服务器中的负载均衡;且所采用的博客主题相关性度量方法能够很好地返回和用户搜索的博客主题相关的网页,能够有效的提高搜索的精度,去除那些主题无关的网页。

专利服务由北京酷爱智慧知识产权代理公司提供