加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种多模型融合的短文本分类方法

发明专利有效专利
  • 申请号:
    CN201510808282.2
  • IPC分类号:G06F17/30;G06K9/62
  • 申请日期:
    2015-11-19
  • 申请人:
    西安交通大学
著录项信息
专利名称一种多模型融合的短文本分类方法
申请号CN201510808282.2申请日期2015-11-19
法律状态授权申报国家中国
公开/公告日2016-04-06公开/公告号CN105468713A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;K;9;/;6;2查看分类表>
申请人西安交通大学申请人地址
陕西省西安市碑林区咸宁西路28号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人西安交通大学当前权利人西安交通大学
发明人鲍军鹏;蒋立华;袁瑞玉;骆玉忠
代理机构西安通大专利代理有限责任公司代理人徐文权
摘要
本发明公开了一种多模型融合的短文本分类方法,包括学习方法和分类方法两部分;学习方法的步骤包括:对短文本训练数据进行分词、过滤,得到单词集合;计算每个单词的IDF值;计算所有单词的TFIDF值,构建文本向量VSM;基于向量空间模型进行文本学习,构建出本体树模型、关键字重叠模型、朴素贝叶斯模型和支持向量机模型。分类方法的步骤包括:对待分类短文本进行分词、过滤;基于向量空间模型生成文本向量;分别应用本体树模型、关键字重叠模型、朴素贝叶斯模型和支持向量机模型进行分类,得到单一模型分类结果;对单一模型分类结果进行融合,得到最终分类结果。本发明方法融合了多种分类模型,提高了短文本分类准确率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供