加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于高级语义的文本摘要生成方法

发明专利有效专利
  • 申请号:
    CN201910227914.4
  • IPC分类号:G06F40/284;G06F40/30;G06N3/04
  • 申请日期:
    2019-03-25
  • 申请人:
    浙江大学
著录项信息
专利名称一种基于高级语义的文本摘要生成方法
申请号CN201910227914.4申请日期2019-03-25
法律状态授权申报国家中国
公开/公告日2019-07-09公开/公告号CN109992775A
优先权暂无优先权号暂无
主分类号G06F40/284IPC分类号G;0;6;F;4;0;/;2;8;4;;;G;0;6;F;4;0;/;3;0;;;G;0;6;N;3;/;0;4查看分类表>
申请人浙江大学申请人地址
浙江省杭州市西湖区余杭塘路866号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人浙江大学当前权利人浙江大学
发明人李昊;蔡登;潘博远;雷陈奕;王国鑫;何晓飞
代理机构杭州天勤知识产权代理有限公司代理人胡红娟
摘要
本发明公开了一种基于高级语义的文本摘要生成方法,包括:(1)将文本语料进行分词并转化为与词汇一一对应的语义标签序列;(2)在文本摘要模型上,使用双向循环网络作为编码器对词汇序列和语义标签序列进行编码,得到词汇上的抽象表征和语义上的抽象表征;(3)将词汇上的抽象表征和语义上的抽象表征进行合并;(4)将合并后的抽象表征送入解码器,分别计算词汇注意力权重和语义注意力权重,同时预测序列每一步在词表上的概率分布;(5)将注意力权重分布和词表概率分布合并,得到最终的输出概率分布,将最终的概率分布转化为可读的词汇,并串连成句进行输出。本发明可以提高模型在预测低频词以及进行无标签数据上的文本摘要的准确率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供