加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

文本分类方法、装置、计算设备和计算机可读介质

发明专利有效专利
  • 申请号:
    CN202110731191.9
  • IPC分类号:G06F16/31;G06F16/35;G06F40/289
  • 申请日期:
    2021-06-30
  • 申请人:
    智者四海(北京)技术有限公司
著录项信息
专利名称文本分类方法、装置、计算设备和计算机可读介质
申请号CN202110731191.9申请日期2021-06-30
法律状态授权申报国家中国
公开/公告日2021-07-27公开/公告号CN113177102A
优先权暂无优先权号暂无
主分类号G06F16/31IPC分类号G;0;6;F;1;6;/;3;1;;;G;0;6;F;1;6;/;3;5;;;G;0;6;F;4;0;/;2;8;9查看分类表>
申请人智者四海(北京)技术有限公司申请人地址
北京市海淀区学院路甲5号1幢三层1#厂房3-011 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人智者四海(北京)技术有限公司当前权利人智者四海(北京)技术有限公司
发明人熊杰;薛娇;王霄琨;王政英;李飞阳;李子中
代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)代理人何明伦
摘要
本申请实施例提供一种文本分类方法、装置、计算设备和计算机可读介质。该方法基于语料库中的词和原始标签集中的标签之间的点互信息构建第一标签索引库,根据待分类文本从第一标签索引库中获取第一标签召回集,以构建待预测标签召回集;通过预训练模型获取待预测标签召回集中每个标签的标签向量表示和待分类文本的文档向量表示,以及将所述文档向量表示与所述每个标签的标签向量表示分别进行拼接,得到一组待预测特征向量;对所述一组待预测特征向量进行预测评分,得到所述待分类文本的预测标签集。本申请可以显著提高多标签文本分类的准确性和处理效率。

专利服务由北京酷爱智慧知识产权代理公司提供