加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

网页信息块提取方法和装置

发明专利无效专利
  • 申请号:
    CN200410057064.1
  • IPC分类号:G06F17/30
  • 申请日期:
    2004-08-25
  • 申请人:
    富士通株式会社;南京大学
著录项信息
专利名称网页信息块提取方法和装置
申请号CN200410057064.1申请日期2004-08-25
法律状态权利终止申报国家中国
公开/公告日2006-04-26公开/公告号CN1763740
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人富士通株式会社;南京大学申请人地址
日本神奈川县 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人富士通株式会社,南京大学当前权利人富士通株式会社,南京大学
发明人王俊;王继成;武港山;津田宏
代理机构北京三友知识产权代理有限公司代理人李辉
摘要
本发明提出了一种网页信息块提取装置和方法。在本发明中,首先生成网页的结构信息块树,并对结构信息块进行分类归并和合并,对进行分类归并的结构信息块的语义进行标记,从而根据内容和功能把网页分割为信息块。特别地,结构层次的自动重复模式发现和语义层次的分类归并是实现本发明的方法和装置的基础和保证。根据本发明的方法和装置,网页处理的粒度从整个页面扩展为页面内的信息块,使网页更容易由机器处理。本发明的方法和装置可以应用于几乎所有类型的网页。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供