加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

Web数据采集方法和Web数据采集系统

发明专利有效专利
  • 申请号:
    CN201711174715.9
  • IPC分类号:H04L29/08;G06F16/951;G06F16/955
  • 申请日期:
    2017-11-22
  • 申请人:
    用友金融信息技术股份有限公司
著录项信息
专利名称Web数据采集方法和Web数据采集系统
申请号CN201711174715.9申请日期2017-11-22
法律状态暂无申报国家中国
公开/公告日2018-05-08公开/公告号CN108011931A
优先权暂无优先权号暂无
主分类号H04L29/08IPC分类号H;0;4;L;2;9;/;0;8;;;G;0;6;F;1;6;/;9;5;1;;;G;0;6;F;1;6;/;9;5;5查看分类表>
申请人用友金融信息技术股份有限公司申请人地址
北京市海淀区永丰路9号院3号楼4层101-C18 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人用友金融信息技术股份有限公司当前权利人用友金融信息技术股份有限公司
发明人韦立鹏
代理机构北京友联知识产权代理事务所(普通合伙)代理人尚志峰;汪海屏
摘要
本发明提出了一种Web数据采集方法、Web数据采集系统、计算机设备、计算机可读存储介质。其中,Web数据采集方法包括:布置待加入虚拟机的爬虫环境;获取待加入虚拟机的IP地址,并将IP地址添加至主节点配置中;控制主机更新运行脚本,以使待加入虚拟机和已加入虚拟机获取最新运行代码;当接收到待加入虚拟机的任务启动指令,根据最新运行代码执行任务启动指令,以使待加入虚拟机加入至爬取网站的集群中并开始Web数据采集。本发明实现了数据源大量增加时,Web数据爬取上和存储上的横向扩展,提高了爬取数据和存储数据的效率,在有限的时间内完成数据的采集。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供