加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种新的面向文本分类的特征向量权重的方法及装置

发明专利无效专利
  • 申请号:
    CN200410062789.X
  • IPC分类号:G06F17/21
  • 申请日期:
    2004-07-09
  • 申请人:
    中国科学院自动化研究所
著录项信息
专利名称一种新的面向文本分类的特征向量权重的方法及装置
申请号CN200410062789.X申请日期2004-07-09
法律状态权利终止申报国家暂无
公开/公告日2006-01-11公开/公告号CN1719436
优先权暂无优先权号暂无
主分类号G06F17/21IPC分类号G;0;6;F;1;7;/;2;1查看分类表>
申请人中国科学院自动化研究所申请人地址
北京市海淀区中关村东路95号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国科学院自动化研究所当前权利人中国科学院自动化研究所
发明人宗成庆;陈克利
代理机构中科专利商标代理有限责任公司代理人周国城
摘要
本发明涉及计算机科学与技术领域,特别是一种新的面向文本分类的特征向量权重的方法。文本分类方法中,TF*IDF和TF*IWF被广泛的用来计算特征向量的权重。但是这两种方法都过分的倚重词频,同时又无法表示出向量元素在类别之间分布的不均衡性。这里,我们提出了一种新的权重方法(TF*IWF*DBV)。在TF*IWF方法中引入了DBV和TF的n次方根弥补了方法的不足。实验证明新方法的采用可以将F1测度提高11.8个百分点,充分证明了它的有效性。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供