加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

用于电力领域的基于知识图谱的文档查重方法

发明专利有效专利
  • 申请号:
    CN202110253322.7
  • IPC分类号:G06F16/33;G06F16/36;G06F40/194;G06N3/04;G06N3/08
  • 申请日期:
    2021-03-05
  • 申请人:
    国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司
著录项信息
专利名称用于电力领域的基于知识图谱的文档查重方法
申请号CN202110253322.7申请日期2021-03-05
法律状态实质审查申报国家中国
公开/公告日2021-06-18公开/公告号CN112988968A
优先权暂无优先权号暂无
主分类号G06F16/33IPC分类号G;0;6;F;1;6;/;3;3;;;G;0;6;F;1;6;/;3;6;;;G;0;6;F;4;0;/;1;9;4;;;G;0;6;N;3;/;0;4;;;G;0;6;N;3;/;0;8查看分类表>
申请人国网湖南省电力有限公司;国网湖南省电力有限公司信息通信分公司;国家电网有限公司申请人地址
湖南省长沙市天心区新韶东路398号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人国网湖南省电力有限公司,国网湖南省电力有限公司信息通信分公司,国家电网有限公司当前权利人国网湖南省电力有限公司,国网湖南省电力有限公司信息通信分公司,国家电网有限公司
发明人黄鑫;陈毅波;黄巍;向行;蒋破荒;张祖平;田建伟;陈远扬;何智强;祝视
代理机构长沙永星专利商标事务所(普通合伙)代理人周咏;米中业
摘要
本发明公开了一种用于电力领域的基于知识图谱的文档查重方法,包括构建训练集;抽取文档中的实体构建实体共现图;对实体共现图进行概念检测;按照概念对句子进行分组,计算概念之间边的权重并构建概念交互图;对句子进行编码并合并编码后的向量;匹配与每个概念相关的两个文档之间的句子集并将局部匹配结果聚合为最终的匹配分数;根据匹配分数对文档进行查重判定。本发明先提出概念交互图,以概念交互图的形式表示文档;然后,通过一系列编码技术比较包含相同概念顶点的句子来匹配一对文档,并通过图卷积层汇总局部匹配结果,从而进行文档的匹配;因此本发明方法的可靠性高、准确性好且效率较高。

专利服务由北京酷爱智慧知识产权代理公司提供