加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于HDBSCAN聚类的自适应过采样方法

发明专利有效专利
  • 申请号:
    CN201910605272.7
  • IPC分类号:G06K9/62
  • 申请日期:
    2019-07-05
  • 申请人:
    重庆信科设计有限公司;重庆市质量和标准化研究院
著录项信息
专利名称基于HDBSCAN聚类的自适应过采样方法
申请号CN201910605272.7申请日期2019-07-05
法律状态实质审查申报国家中国
公开/公告日2019-11-12公开/公告号CN110443281A
优先权暂无优先权号暂无
主分类号G06K9/62IPC分类号G;0;6;K;9;/;6;2查看分类表>
申请人重庆信科设计有限公司;重庆市质量和标准化研究院申请人地址
重庆市北部新区高新园星光大道76号B1-16-1 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人重庆信科设计有限公司,重庆市质量和标准化研究院当前权利人重庆信科设计有限公司,重庆市质量和标准化研究院
发明人董宏成;赵学华;刘颖;解如风;范荣妹
代理机构重庆市恒信知识产权代理有限公司代理人刘小红;陈栋梁
摘要
本发明请求保护一种基于HDBSCAN聚类的自适应过采样方法,主要解决现有方法中利用完整数据信息的不平衡数据分类问题。所述技术的步骤为:(1)输入训练数据集;(2)对训练集中的少数类样本进行聚类得到不同规模且互不相交的集群;(3)计算每个少数类集群中需要合成的样本数量;(4)根据每个集群需要合成的样本数量自适应地合成新的样本得到新的少数类数据集;(5)多数类数据集和新的少数类数据集形成新的平衡数据集;(6)利用新的平衡数据集训练并测试分类器。本技术可有效避免不平衡数据集中噪声的产生并同时克服类间和类内不平衡问题,为不平衡学习提供了一种全新的过采样策略。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供