一种新闻网页元数据自动抽取方法

专利类型:
发明专利(1)
专利有效性:
无效专利(1)
法律状态:
权利终止(1)
高级筛选:

路标网共为您找到相关结果1

公开(公告)时间
申请时间

一种新闻网页元数据自动抽取方法

发明专利无效专利
  • 申请号:CN200810038788.X
  • 申请人:华东师范大学
  • 申请日:2008-06-11
  • 主分类号:G06F17/30
  • 公开(公告)日:2008-10-22
  • 公开/公告号:CN101290624
申请同类专利

摘要:本发明涉及一种在互联网新闻网页上进行元数据自动抽取的方法,元数据抽取系统向新闻网站服务器发送网页请求,服务器在通过一定的安全检测后将所要求的页面发往元数据抽取模块主机。元数据抽取系统在得到了一定数量的网页集合后,通过DOM技术深入分析每个网页内部的信息,挖掘集合内各个网页间的相互关系,最终得到标准所规定的元数据值。系统将元数据值转化为XML格式后,通过I/O接口向外部存储设备输出,形成XML格式的元数据文件。本发明实现了在无人工干预的情况下,系统依据依据相关元数据标准从目标文档中自动抽取元数据信息,并将结果进行合理组织和存储的全过程。

著录信息权利要求说明书PDF全文法律状态引证文献
  • 1
前往
没找到想要的结果?为您推荐专业专利顾问检索  一种新闻网页元数据自动抽取方法 专利,更快更准确
免费
我想查:已帮助11110098位用户进行查询

*来源于国家知识产权局数据,仅供参考,专利服务由北京酷爱智慧知识产权代理公司提供