加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种面向在线百科的实体属性抽取方法及系统

发明专利有效专利
  • 申请号:
    CN201410065743.7
  • IPC分类号:G06F17/30
  • 申请日期:
    2014-02-26
  • 申请人:
    中国科学院计算技术研究所
著录项信息
专利名称一种面向在线百科的实体属性抽取方法及系统
申请号CN201410065743.7申请日期2014-02-26
法律状态授权申报国家中国
公开/公告日2014-06-11公开/公告号CN103853823A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人中国科学院计算技术研究所申请人地址
北京市海淀区中关村科学院南路6号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国科学院计算技术研究所当前权利人中国科学院计算技术研究所
发明人程学旗;贾岩涛;张泽慧;王元卓;冯凯;熊锦华;许洪波
代理机构北京泛华伟业知识产权代理有限公司代理人王勇;李科
摘要
本发明提供一种面向在线百科的实体属性抽取方法及系统,该方法包括:在待抽取的在线百科网页文本集合T中选择一个页面,抽取该页面的实体属性表达规则,得到当前规则集合。该方法还包括使用当前规则集合对所述待抽取的在线百科网页文本集合T进行实体属性抽取,并且根据抽取得到的实体属性抽取T的实体属性表达规则,用抽取得到的规则集合作为当前规则集合并重复这一过程k次,得到最终规则集合。使用所述最终规则集合对T进行实体属性抽取。本发明提供的实体属性抽取方法能够适应文本结构的变化,适用于各种在线百科,具有召回率高并且准确率高的效果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供