加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于文本的关键词提取方法和计算机设备

发明专利有效专利
  • 申请号:
    CN201910360872.1
  • IPC分类号:G06F17/27;G06F16/33;G06F16/35;G06N3/04
  • 申请日期:
    2019-04-30
  • 申请人:
    腾讯科技(深圳)有限公司
著录项信息
专利名称基于文本的关键词提取方法和计算机设备
申请号CN201910360872.1申请日期2019-04-30
法律状态公开申报国家中国
公开/公告日2019-08-09公开/公告号CN110110330A
优先权暂无优先权号暂无
主分类号G06F17/27IPC分类号G;0;6;F;1;7;/;2;7;;;G;0;6;F;1;6;/;3;3;;;G;0;6;F;1;6;/;3;5;;;G;0;6;N;3;/;0;4查看分类表>
申请人腾讯科技(深圳)有限公司申请人地址
广东省深圳市南山区高新区科技中一路腾讯大厦35层 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人腾讯科技(深圳)有限公司当前权利人腾讯科技(深圳)有限公司
发明人李钊
代理机构北京同达信恒知识产权代理有限公司代理人郭润湘;李娟
摘要
本申请公开了一种基于文本的关键词提取方法和计算机设备,属于人工智能技术领域,用于高效的挖掘文本中的关键词。该方法采用了Seq2seq网络结构。该网络结构包括编码器和解码器以及具有注意力机制的神经网络模块对编码器的输出结果进行调整。该方法中将整个文本作为输入,使得神经网络能够了解文本的上下文信息。由于无需提取特征向量,免去了TextRank中从文本中抽象出特征的麻烦。由于无需主观的进行特征抽象,故此实现相对简单,关键词的提取在长文本和短文本中均适用,效果也比较稳定。此外,该方法输出的是向量而不是关键词,具有很好的泛化能力。进一步外,通过引入注意力机制,能够使得关键词挖掘更为准确。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供