加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

文件标签分类方法及装置

发明专利有效专利
  • 申请号:
    CN202010806917.6
  • IPC分类号:G06F16/35;G06F16/31;G06K9/62
  • 申请日期:
    2020-08-12
  • 申请人:
    中国银行股份有限公司
著录项信息
专利名称文件标签分类方法及装置
申请号CN202010806917.6申请日期2020-08-12
法律状态公开申报国家中国
公开/公告日2020-11-13公开/公告号CN111930944A
优先权暂无优先权号暂无
主分类号G06F16/35IPC分类号G;0;6;F;1;6;/;3;5;;;G;0;6;F;1;6;/;3;1;;;G;0;6;K;9;/;6;2查看分类表>
申请人中国银行股份有限公司申请人地址
北京市西城区复兴门内大街1号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国银行股份有限公司当前权利人中国银行股份有限公司
发明人虞樱
代理机构北京三友知识产权代理有限公司代理人谷敬丽;薛平
摘要
本发明提供了一种文件标签分类方法及装置,该方法包括:提取标签体系树中每个节点的主题词,所述标签体系树包括多个文件的多级节点的主题词;将标签体系树中每个叶节点的向上多级节点的主题词加入至一个类别组中,形成每个类别组对应的主题词集合;获得每个类别组对应的特征词集合,将每个类别组对应的特征词集合中的特征词加入至该类别组对应的主题词集合中;根据每个类别组对应的主题词集合和多个文件,创建倒排序索引文件树,并基于倒排序索引文件树,构造训练集;采用所述训练集训练文本分类模型,获得训练好的文本分类模型;将待分类文件输入至训练好的文本分类模型,预测待分类文件的标签分类。本发明可以对文件标签进行快速、准确地分类。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供