首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种多篇文档重点信息提取方法

发明专利有效专利
  • 申请号:
    CN202011623567.6
  • IPC分类号:G06F16/34G06F16/36G06N3/04
  • 申请日期:
    2020-12-31
  • 申请人:
    山西三友和智慧信息技术股份有限公司
著录项信息
专利名称一种多篇文档重点信息提取方法
申请号CN202011623567.6申请日期2020-12-31
法律状态实质审查申报国家中国
公开/公告日2021-05-11公开/公告号CN112784035A
优先权暂无优先权号暂无
主分类号G06F16/34IPC分类号G06F16/34;G06F16/36;G06N3/04查看分类表>
申请人山西三友和智慧信息技术股份有限公司申请人地址
山西省太原市高新区科技街15号A1*** 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人山西三友和智慧信息技术股份有限公司当前权利人山西三友和智慧信息技术股份有限公司
发明人王小华;焦璐璐;易传润;王宇琦;韩锋
代理机构太原荣信德知识产权代理事务所(特殊普通合伙)代理人杨凯;连慧敏
摘要
本发明涉及文档信息处理领域,具体涉及一种多篇文档重点信息提取方法。包括以下步骤:S1、构建学习模型,通过神经网络Seq2Seq框架对大规模语料进行学习,得到模型;S2、输入选定文档,将所需处理的文档输入S1中得到的模型中,并输出相应的主题句;S3、生成重点信息,通过系统分析,对S2中主题句进行合理的组织,提炼得到多篇文档重点信息总结论述;S4、评价分析,对生成的多篇文档重点信息总结进行评价,判定是否符合需要。本发明设计巧妙,通过计算机辅助操作人员对多篇文档进行处理,有效提高文档阅读效率,适合广泛推广使用。

专利服务由北京酷爱智慧知识产权代理公司提供