加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于机器学习排序的学术文本词汇功能识别方法

发明专利无效专利
  • 申请号:
    CN201710204292.4
  • IPC分类号:G06F17/27
  • 申请日期:
    2017-03-30
  • 申请人:
    万迅
著录项信息
专利名称一种基于机器学习排序的学术文本词汇功能识别方法
申请号CN201710204292.4申请日期2017-03-30
法律状态驳回申报国家中国
公开/公告日2017-07-14公开/公告号CN106951414A
优先权暂无优先权号暂无
主分类号G06F17/27IPC分类号G;0;6;F;1;7;/;2;7查看分类表>
申请人万迅申请人地址
湖北省武汉市洪山区街道口兆富国际2406 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人万迅当前权利人万迅
发明人万迅;程齐凯;陆伟
代理机构武汉科皓知识产权代理事务所(特殊普通合伙)代理人魏波
摘要
本发明公开了一种基于机器学习排序的学术文本词汇功能识别方法,包括构造训练数据;基于排序的识别方法;特征构造;模型训练;利用训练得到的模型对文档摘要包含的词汇序列进行排序,对排序生成的结果,使用top1的结果作为抽取结果等5步骤,本发明通过在构建的训练集(CNKI数据库中收集的18690篇标题符合特定模式的文档摘要数据)中学习模型,对测试数据(从ACM和ACL收录文献中抽取并筛选后得到156篇文献)包含的词汇序列进行排序。其实验结果表明,在识别论文的核心问题和核心方法上具有较好的识别效果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供