加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

网页内容获取方法和系统

发明专利有效专利
  • 申请号:
    CN201010240330.X
  • IPC分类号:H04L29/06;H04L29/08;G06F17/30
  • 申请日期:
    2010-07-26
  • 申请人:
    中国电信股份有限公司
著录项信息
专利名称网页内容获取方法和系统
申请号CN201010240330.X申请日期2010-07-26
法律状态授权申报国家暂无
公开/公告日2012-02-08公开/公告号CN102347930A
优先权暂无优先权号暂无
主分类号H04L29/06IPC分类号H;0;4;L;2;9;/;0;6;;;H;0;4;L;2;9;/;0;8;;;G;0;6;F;1;7;/;3;0查看分类表>
申请人中国电信股份有限公司申请人地址
北京市西城区金融大街31号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国电信股份有限公司当前权利人中国电信股份有限公司
发明人王爱宝;张涛;李屹;杨德利
代理机构中国国际贸易促进委员会专利商标事务所代理人孙宝海
摘要
本发明公开了一种网页内容获取的方法与系统。其中,该方法包括判断网站中的网页是否满足上报触发条件;在网页满足上报触发条件时,网站上报网页信息;分配服务器根据上报的网页信息安排爬虫到网页中抓取网页的内容。本发明在网页满足上报触发条件时上报网页信息,爬虫根据网页信息到指定网页中抓取网页的内容。该方法节约了爬虫的工作量,缓解了目标网站的压力,并且增加了获取实时信息的能力,为实时搜索提供了有利的条件。

专利服务由北京酷爱智慧知识产权代理公司提供