加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于改进TopicRank算法的文本关键词抽取方法

发明专利有效专利
  • 申请号:
    CN202010743694.3
  • IPC分类号:--
  • 申请日期:
    2020-07-29
  • 申请人:
    华中师范大学
著录项信息
专利名称一种基于改进TopicRank算法的文本关键词抽取方法
申请号CN202010743694.3申请日期2020-07-29
法律状态实质审查申报国家中国
公开/公告日2020-10-30公开/公告号CN111859961A
优先权暂无优先权号暂无
主分类号暂无IPC分类号暂无查看分类表>
申请人华中师范大学申请人地址
湖北省武汉市珞喻路152号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人华中师范大学当前权利人华中师范大学
发明人廖盛斌;郑章雄
代理机构武汉东喻专利代理事务所(普通合伙)代理人雷霄
摘要
本发明公开了一种基于改进TopicRank算法的文本关键词抽取方法,包括步骤:对文本进行预处理,从预处理后的文本中抽取候选关键词,并对候选关键词进行向量化,然后对向量化后的候选关键词进行聚类生成主题;构建图模型,利用图模型获取每个主题的分值。其中,图模型的顶点代表主题,图模型的边代表构成边的两个顶点所表示主题间的语义关系,边对应的分值权重由主题包含的候选关键词的相对位置、绝对位置和长度确定;从高到低选取分值最高的n个主题,n为预先定义的正整数,从选取的n个主题包含的候选关键词中选取最终文本关键词。本发明能够有效改进TopicRank算法抽取关键词的效果,提高抽取关键词的准确率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供