加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种互联网主题信息采集方法及装置

发明专利无效专利
  • 申请号:
    CN200910110356.X
  • IPC分类号:G06F17/30
  • 申请日期:
    2009-10-28
  • 申请人:
    深圳市同洲电子股份有限公司
著录项信息
专利名称一种互联网主题信息采集方法及装置
申请号CN200910110356.X申请日期2009-10-28
法律状态权利终止申报国家暂无
公开/公告日2010-05-05公开/公告号CN101702160A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人深圳市同洲电子股份有限公司申请人地址
广东省深圳市南山区高新区北区第五工业区彩虹科技大楼A2-3区 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人深圳市龙视传媒有限公司当前权利人深圳市龙视传媒有限公司
发明人黎柯
代理机构广州三环专利代理有限公司代理人郝传鑫;潘中毅
摘要
本发明提供了一种互联网主题信息采集方法及装置,所述方法包括:获取互联网网页的超文本标记语言HTML源代码;以div标签为标志标签将所述HTML源代码分成不同的字符串,并将所述不同的字符串形成字符串列表;逐一分析所述字符串列表中的每个字符串,当某个字符串中的HTML标签外的字符个数大于所述HTML标签内的字符个数,且HTML标签外的字符个数大于设定的基数时,将该字符串包含的内容作为主题信息。实施本发明提供的互联网主题信息采集方法和装置,通过以div标签将HTML源代码划分成多个字符串,对多个字符串进行分析,从而获取主题信息,可处理互联网上不同网页模板的网页信息,并提高主题信息采集的准确性。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供