加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

短文本之间的文本匹配度计算方法

发明专利有效专利
  • 申请号:
    CN201611256117.1
  • IPC分类号:G06K9/62;G06F16/30
  • 申请日期:
    2016-12-30
  • 申请人:
    中国银联股份有限公司
著录项信息
专利名称短文本之间的文本匹配度计算方法
申请号CN201611256117.1申请日期2016-12-30
法律状态授权申报国家中国
公开/公告日2017-07-25公开/公告号CN106980870A
优先权暂无优先权号暂无
主分类号G06K9/62IPC分类号G;0;6;K;9;/;6;2;;;G;0;6;F;1;6;/;3;0查看分类表>
申请人中国银联股份有限公司申请人地址
上海市浦东新区含笑路36号银联大厦 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国银联股份有限公司当前权利人中国银联股份有限公司
发明人王宇;华锦芝;郑建宾;张琦;冯亮
代理机构中国专利代理(香港)有限公司代理人王星;付曼
摘要
本发明涉及一种短文本之间的文本匹配度计算方法,包括如下步骤:对第一文本、第二文本进行分词,以分别获得第一、第二文本的分词序列;分别确定第一文本、第二文本的匹配序列;确定第一文本的匹配序列中的第i+1个字符与第i个字符在第二文本中的位置间隔;基于各位置间隔、利用短语相似度计算方法来计算第一、第二文本之间的相同字符匹配度;计算第一文本的匹配序列与第二文本的匹配序列之间的编辑距离;以及,基于第一、第二文本之间的相同字符匹配度、编辑距离、以及第一、第二文本各自的字符串长度,计算第一、第二文本之间的文本匹配度。应用这种方法,不仅对文本的匹配准确率更高,而且鲁棒性良好,也具有更高的敏感性和特异性。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供