加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于引文网络的论文文本相似性的检测方法

发明专利有效专利
  • 申请号:
    CN201910701668.1
  • IPC分类号:G06F40/205;G06K9/62
  • 申请日期:
    2019-07-31
  • 申请人:
    北京大学;重庆泛语科技有限公司
著录项信息
专利名称基于引文网络的论文文本相似性的检测方法
申请号CN201910701668.1申请日期2019-07-31
法律状态授权申报国家中国
公开/公告日2019-11-22公开/公告号CN110489745A
优先权暂无优先权号暂无
主分类号G06F40/205IPC分类号G;0;6;F;4;0;/;2;0;5;;;G;0;6;K;9;/;6;2查看分类表>
申请人北京大学;重庆泛语科技有限公司申请人地址
北京市海淀区颐和园路5号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京大学,重庆泛语科技有限公司当前权利人北京大学,重庆泛语科技有限公司
发明人武山山;王继民;罗鹏程;赵常煜
代理机构北京万象新悦知识产权代理有限公司代理人贾晓玲
摘要
本发明提供一种基于引文网络的论文文本相似性的检测方法,该方法在引文网络的基础上提出了基于书目耦合与语义指纹相结合的候选文档集过滤,在候选文档集上,基于词建立句子级别的倒排索引,进行相似句子检测与观点片段检测,生成相似文本,计算得到待检文档的复制比,从而判断出论文文本的相似性。本发明基于词向量的句子比对与观点检测,将词向量与同义词引入到文本相似性计算中,提升了句子相似性的计算效果且具有计算速度快的优点,能够检测出论文文本中可能涉及观点抄袭的文本片段。采用本发明不仅速度快,而且对词语替换、句子重组等形式的句子相似性检测具有好的效果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供