基于文本的关键词提取方法和计算机设备

发明专利有效专利

申请号：
CN201910360872.1
IPC分类号：G06F17/27;G06F16/33;G06F16/35;G06N3/04
申请日期：
2019-04-30
申请人：
腾讯科技（深圳）有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	基于文本的关键词提取方法和计算机设备
申请号	CN201910360872.1	申请日期	2019-04-30
法律状态	公开	申报国家	中国
公开/公告日	2019-08-09	公开/公告号	CN110110330A
优先权	暂无	优先权号	暂无
主分类号	G06F17/27 ? IPC结构图谱： G 物理 G0 仪器 G06 计算；推算；计数 G06F 电数字数据处理（基于特定计算模型的计算机系统入G06N） G06F17/00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法〔6〕 G06F17/20 处理自然语言数据的（语言分析或综合入G10L）〔6〕 G06F17/27 自动分析的，例如语法分析、正射校正的〔6〕	IPC分类号	G;0;6;F;1;7;/;2;7;;;G;0;6;F;1;6;/;3;3;;;G;0;6;F;1;6;/;3;5;;;G;0;6;N;3;/;0;4查看分类表>
申请人	腾讯科技（深圳）有限公司	申请人地址	广东省深圳市南山区高新区科技中一路腾讯大厦35层变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	腾讯科技（深圳）有限公司	当前权利人	腾讯科技（深圳）有限公司
发明人	李钊
代理机构	北京同达信恒知识产权代理有限公司	代理人	郭润湘;李娟

摘要

本申请公开了一种基于文本的关键词提取方法和计算机设备，属于人工智能技术领域，用于高效的挖掘文本中的关键词。该方法采用了Seq2seq网络结构。该网络结构包括编码器和解码器以及具有注意力机制的神经网络模块对编码器的输出结果进行调整。该方法中将整个文本作为输入，使得神经网络能够了解文本的上下文信息。由于无需提取特征向量，免去了TextRank中从文本中抽象出特征的麻烦。由于无需主观的进行特征抽象，故此实现相对简单，关键词的提取在长文本和短文本中均适用，效果也比较稳定。此外，该方法输出的是向量而不是关键词，具有很好的泛化能力。进一步外，通过引入注意力机制，能够使得关键词挖掘更为准确。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供