加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种网络爬虫实现方法和网络爬虫系统

发明专利无效专利
  • 申请号:
    CN201510901579.3
  • IPC分类号:G06F17/30
  • 申请日期:
    2015-12-08
  • 申请人:
    北京奇虎科技有限公司;奇智软件(北京)有限公司
著录项信息
专利名称一种网络爬虫实现方法和网络爬虫系统
申请号CN201510901579.3申请日期2015-12-08
法律状态驳回申报国家中国
公开/公告日2016-02-24公开/公告号CN105354337A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人北京奇虎科技有限公司;奇智软件(北京)有限公司申请人地址
北京市西城区新街口外大街28号D座112室(德胜园区) 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京奇虎科技有限公司,奇智软件(北京)有限公司当前权利人北京奇虎科技有限公司,奇智软件(北京)有限公司
发明人葛山
代理机构北京市隆安律师事务所代理人权鲜枝;何立春
摘要
本发明公开了一种网络爬虫实现方法和网络爬虫系统。其中所述方法包括:模拟用户对网页的访问操作发送网页访问请求;根据网页访问请求对应的反馈内容获得相应的网页内容;分析获得的网页内容,获得目标信息。通过该技术方案实现的网络爬虫并不直接访问网站服务器获取资源,而是通过模拟正常用户的网页访问请求,在客户端如浏览器获取到网页内容,避免了受到网站设置的robots.txt中对网络爬虫获取数据内容的限制,并且获取到的内容也是通过正当途径访问网页获取的,既可以满足用户爬取数据的需求,也不违反网站服务提供方的约束。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供