加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

Web信息抽取系统

发明专利无效专利
  • 申请号:
    CN200910012239.X
  • IPC分类号:G06F17/30
  • 申请日期:
    2009-06-24
  • 申请人:
    大连海事大学
著录项信息
专利名称Web信息抽取系统
申请号CN200910012239.X申请日期2009-06-24
法律状态权利终止申报国家暂无
公开/公告日2009-11-18公开/公告号CN101582075
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人大连海事大学申请人地址
辽宁省大连市甘井子区凌海路1号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人大连海事大学当前权利人大连海事大学
发明人陈荣;郭银蕊;刘亚清;陈涛;陈娟;孙向伟;史玉翡
代理机构大连东方专利代理有限责任公司代理人李洪福
摘要
本发明公开了一种Web信息抽取系统,其特征在于包括:检索解析模块、规则生成模块和数据抽取存储模块:检索解析模块包括网络爬虫单元和HTML解析器;规则生成模块包括单槽抽取规则生成单元和多槽抽取规则生成单元;数据抽取存储模块,规则生成模块生成的抽取规则,从检索解析模块下载的网页上提取数据并以结构化的形式存储。该系统具有:生成单槽抽取规则时界面操作简单、容易理解;对于生成多槽抽取规则,系统提供图形界面帮助用户标注,节省用户的时间和体力;对于预先生成的抽取规则和任务序列,系统提供两种方式实现批量任务的抽取和存储;系统可以根据用户配置的参数,在预先设定的周期和时间完成抽取存储任务。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供