加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于上下文关联的中文相似性比较方法

发明专利无效专利
  • 申请号:
    CN201110303533.3
  • IPC分类号:G06F17/27
  • 申请日期:
    2011-10-09
  • 申请人:
    北京航空航天大学
著录项信息
专利名称一种基于上下文关联的中文相似性比较方法
申请号CN201110303533.3申请日期2011-10-09
法律状态权利终止申报国家中国
公开/公告日2012-01-11公开/公告号CN102314418A
优先权暂无优先权号暂无
主分类号G06F17/27IPC分类号G;0;6;F;1;7;/;2;7查看分类表>
申请人北京航空航天大学申请人地址
北京市海淀区学院路37号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京航空航天大学当前权利人北京航空航天大学
发明人赵长海;晏海华;郎钰泽
代理机构北京永创新实专利事务所代理人周长琪
摘要
本发明提出一种基于上下文关联的中文相似性比较方法,应用于中文相似性比较技术领域,该方法首先将要进行比较的两篇文本的文本流进行分词和索引,为每一个文本建立倒排表,然后对倒排表进行相似性检测,得到可疑相似片段,最后对可疑相似片段进行聚合,得到相似文本块,在相似文本块的生成过程中考虑到上下文的关联。本发明方法先发现较小可疑相似片段,再对可疑相似片段进行聚合,减少了空间向量模型中粒度大小与误判、漏判率之间的矛盾,实现对两篇文本的相似性比较。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供