加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于图书目录的知识图谱的构建方法

发明专利有效专利
  • 申请号:
    CN201310601668.7
  • IPC分类号:G06F17/30;G06F17/27
  • 申请日期:
    2013-11-22
  • 申请人:
    浙江大学
著录项信息
专利名称一种基于图书目录的知识图谱的构建方法
申请号CN201310601668.7申请日期2013-11-22
法律状态授权申报国家中国
公开/公告日2014-04-16公开/公告号CN103729402A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;F;1;7;/;2;7查看分类表>
申请人浙江大学申请人地址
浙江省杭州市浙大路38号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人浙江大学当前权利人浙江大学
发明人鲁伟明;张萌;魏宝刚;庄越挺
代理机构杭州求是专利事务所有限公司代理人张法高
摘要
本发明公开了一种基于图书目录的知识图谱的构建方法。它抽取数字化图书中的目录页,区分目录中条目长度,将长条目用自然语言处理工具进行词性标注得到词性数组,利用连词、标点和词性规则提取出候选节点,然后与短条目一起,去百度百科、互动百科中鉴定并利用目录结构形成上下级关系和并列关系,作为知识图谱的骨架,同时区分出强弱并列关系,分别作为增量补充进上下级关系,并根据以后缀为基础的挖掘噪声数据的算法,从未通过百科鉴定的条目中选取出节点补充进知识图谱,最后,对补充完的知识图谱中的关系,算其权重再进行排序,从而筛选掉噪声。本发明比目前已有的知识图谱有更丰富的节点,更好的可扩展性,及更高的准确率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供