加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种文档标签生成方法、系统及可读存储介质

发明专利有效专利
  • 申请号:
    CN202110173106.1
  • IPC分类号:G06F16/35;G06F16/38;G06F40/284;G06F40/295
  • 申请日期:
    2021-02-08
  • 申请人:
    民生科技有限责任公司
著录项信息
专利名称一种文档标签生成方法、系统及可读存储介质
申请号CN202110173106.1申请日期2021-02-08
法律状态实质审查申报国家中国
公开/公告日2021-08-06公开/公告号CN113220872A
优先权暂无优先权号暂无
主分类号G06F16/35IPC分类号G;0;6;F;1;6;/;3;5;;;G;0;6;F;1;6;/;3;8;;;G;0;6;F;4;0;/;2;8;4;;;G;0;6;F;4;0;/;2;9;5查看分类表>
申请人民生科技有限责任公司申请人地址
北京市顺义区马坡镇顺安南路86号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人民生科技有限责任公司当前权利人民生科技有限责任公司
发明人李振;尹正;刘昊霖;鲍东岳;张雨枫;徐超
代理机构北京金智普华知识产权代理有限公司代理人巴晓艳
摘要
本发明提供了一种文档标签生成方法、系统及可读存储介质,包括以下步骤:S1自动化标签库生成:通过文章主题模型和命名实体抽取算法,从有限数量的文档中,获取关键词标签和名词实体标签,生成自动化标签库;S2标签分类算法:通过文本多分类模型,对系统原有文档和新入系统文档进行处理,通过S1生成的自动化标签库对文本多分类模型的分类结果进行匹配,生成对应的标签;S3标签反馈机制:对没有获得标签的文档重新通过S1中方法,获取关键词标签和名词实体标签并加入自动化标签库;S4标签库后期维护:对人工录入的标签进行筛选和/或去重处理并添加到自动化标签库中,同时定期训练文本多分类模型。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供