加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于聚集爬虫的网页获取装置

实用新型专利无效专利
  • 申请号:
    CN201120546414.6
  • IPC分类号:--
  • 申请日期:
    2011-12-23
  • 申请人:
    江苏省现代企业信息化应用支撑软件工程技术研发中心
著录项信息
专利名称一种基于聚集爬虫的网页获取装置
申请号CN201120546414.6申请日期2011-12-23
法律状态权利终止申报国家中国
公开/公告日公开/公告号
优先权暂无优先权号暂无
主分类号暂无IPC分类号暂无查看分类表>
申请人江苏省现代企业信息化应用支撑软件工程技术研发中心申请人地址
江苏省苏州市致能大道106号苏州市职业大学信知楼2-309室 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人江苏省现代企业信息化应用支撑软件工程技术研发中心当前权利人江苏省现代企业信息化应用支撑软件工程技术研发中心
发明人鲜学丰;李金祥;方立刚;杨元峰;赵朋朋;李亚琴
代理机构北京远大卓悦知识产权代理事务所(普通合伙)代理人史霞
摘要
本实用新型公开了一种基于聚集爬虫的网页获取装置,包括:爬取器;主控器,其包括有URL抓取器、URL分析器以及用于与计算机通信的通信模块,所述URL抓取器连接于所述URL分析器,所述URL抓取器和所述URL分析器均连接于所述通信模块,所述主控器与所述爬取器连接,所述爬取器还连接于所述通信模块。在本实用新型的网页获取装置中,在主控器内的URL分析器内设定URL模板,并URL分析器过滤URL抓取器获取的不相关的URL链接地址,以去除无用链接;并且对爬取器所获取的页面进行判断,以获得所需的页面,提高了爬取效率,更加满足用户需求。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供