加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

网页中关键图片的抓取方法和装置

发明专利有效专利
  • 申请号:
    CN201110443869.X
  • IPC分类号:G06F16/953;G06F16/9535
  • 申请日期:
    2011-12-27
  • 申请人:
    腾讯科技(北京)有限公司
著录项信息
专利名称网页中关键图片的抓取方法和装置
申请号CN201110443869.X申请日期2011-12-27
法律状态授权申报国家暂无
公开/公告日2013-07-03公开/公告号CN103186532A
优先权暂无优先权号暂无
主分类号G06F16/953IPC分类号G;0;6;F;1;6;/;9;5;3;;;G;0;6;F;1;6;/;9;5;3;5查看分类表>
申请人腾讯科技(北京)有限公司申请人地址
北京市海淀区海淀大街38号银科大厦16层1601-1608室 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人腾讯科技(北京)有限公司当前权利人腾讯科技(北京)有限公司
发明人李晓明;刘臻;蒋有星
代理机构北京德琦知识产权代理有限公司代理人张晓峰;宋志强
摘要
本发明公开了一种网页中关键图片的抓取方法和装置,方法包括:A、根据网页地址获取网页的DOM结构;B、根据网页的DOM结构定位网页的中心节点;C、正则匹配所述中心节点及其兄弟节点处的图片,按照预设的过滤条件对正则匹配出的图片进行过滤,输出符合过滤条件的图片;D、将步骤C输出的图片作为抓取到的所述网页的关键图片。所述装置包括对应的DOM结构获取模块、节点确定模块、正则匹配模块、过滤器、以及关键图片确定模块。利用本发明,可以提高所抓取网页的关键图片与网页主题内容的符合程度,降低人机交互次数,简化操作。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供