加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种优化的随机森林处理不平衡数据集的方法

发明专利有效专利
  • 申请号:
    CN202110110757.6
  • IPC分类号:G06K9/62
  • 申请日期:
    2021-01-27
  • 申请人:
    中山大学
著录项信息
专利名称一种优化的随机森林处理不平衡数据集的方法
申请号CN202110110757.6申请日期2021-01-27
法律状态实质审查申报国家中国
公开/公告日2021-05-25公开/公告号CN112836735A
优先权暂无优先权号暂无
主分类号G06K9/62IPC分类号G;0;6;K;9;/;6;2查看分类表>
申请人中山大学申请人地址
广东省广州市海珠区新港西路135号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中山大学当前权利人中山大学
发明人卢宇彤;邓雷
代理机构深圳市创富知识产权代理有限公司代理人高冰
摘要
本发明公开了一种优化的随机森林处理不平衡数据集的方法,所述方法包括数据预处理、随机森林模型的构建和分类预测,其中,所述数据预处理部分将找出少数类样本最近邻的k个多数类样本,组成难区分的区域,将这个区域的样本在原始数据集中进行重标签,且在难区分的区域进行少数类样本的生成,将重标签后的原始数据以及新增样本后的难区分区域作为不同的训练集输出;所述随机森林模型的构建将经过所述数据预处理部分处理的2个数据集作为模型的训练集,得到两个随机森林模型,所述分类预测将分两个阶段进入到所述的两个随机森林模型进行验证,最后获得样本的分类预测结果。本发明达到对少数类预测性能提升的同时,对多数类的预测正确率不会下降严重的目的。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供