加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于词频偏差率因子的特征选择方法

发明专利有效专利
  • 申请号:
    CN202010373715.7
  • IPC分类号:G06K9/62;G06F40/289;G06F16/35
  • 申请日期:
    2020-05-06
  • 申请人:
    西安理工大学
著录项信息
专利名称基于词频偏差率因子的特征选择方法
申请号CN202010373715.7申请日期2020-05-06
法律状态实质审查申报国家中国
公开/公告日2020-09-25公开/公告号CN111709439A
优先权暂无优先权号暂无
主分类号G06K9/62IPC分类号G;0;6;K;9;/;6;2;;;G;0;6;F;4;0;/;2;8;9;;;G;0;6;F;1;6;/;3;5查看分类表>
申请人西安理工大学申请人地址
陕西省西安市碑林区金花南路5号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人西安理工大学当前权利人西安理工大学
发明人周红芳;马一鸣;李想
代理机构西安弘理专利事务所代理人弓长
摘要
本发明公开了一种基于词频偏差率因子的特征选择方法,具体按照以下步骤实施:步骤1、对数据集进行预处理,并将数据集划分为训练集和测试集;步骤2、使用词频偏差率测量的特征选择算法,设置要选择的特征数,排序,输出最优特征子集;步骤3、对最优特征子集进行训练和分类,获取分类结果,并对分类结果进行评估。本发明的方法用于文本分类的特征选择,从词频的角度考虑了术语与类别之间的相关性大小,通过与传统的基于文档频率的算法相结合,算法性能有了很大的提高。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供