加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种网络数据爬取方法和装置

发明专利有效专利
  • 申请号:
    CN201611243880.0
  • IPC分类号:G06F16/951
  • 申请日期:
    2016-12-29
  • 申请人:
    北京市天元网络技术股份有限公司
著录项信息
专利名称一种网络数据爬取方法和装置
申请号CN201611243880.0申请日期2016-12-29
法律状态授权申报国家中国
公开/公告日2017-06-13公开/公告号CN106844522A
优先权暂无优先权号暂无
主分类号G06F16/951IPC分类号G;0;6;F;1;6;/;9;5;1查看分类表>
申请人北京市天元网络技术股份有限公司申请人地址
北京市海淀区西北旺东路10号院东区20号楼浪潮大厦 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京天元创新科技有限公司当前权利人北京天元创新科技有限公司
发明人孙建通;李智;徐辉
代理机构北京路浩知识产权代理有限公司代理人李相雨
摘要
本发明实施例提供了一种网络数据爬取方法和装置,所述方法包括:通过网页测试工具打开浏览器,并打开待爬取数据的网站;根据预先设置的目标数据网页结构,通过所述网页测试工具模拟用户浏览所述网站,获取所述网站上目标数据标签对应的所有网页的页面信息;分别对获取到的所述页面信息进行分析,根据所述目标数据标签获取对应的目标数据。所述装置用于执行上述方法。本发明实施例通过控制浏览器对待爬取数据的网站进行浏览,并采用网页测试工具即selenium模拟用户浏览网站,可以很好的避免因网站反爬机制造成数据爬取失败的问题,提高了网络数据爬取的成功率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供