首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种大数据分类方法及系统

发明专利有效专利
  • 申请号:
    CN201310727192.1
  • IPC分类号:G06F17/30
  • 申请日期:
    2013-12-25
  • 申请人:
    中国科学院计算技术研究所
著录项信息
专利名称一种大数据分类方法及系统
申请号CN201310727192.1申请日期2013-12-25
法律状态授权申报国家中国
公开/公告日2014-04-16公开/公告号CN103729428A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G06F17/30查看分类表>
申请人中国科学院计算技术研究所申请人地址
北京市海淀区中关村科学院南*** 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国科学院计算技术研究所当前权利人中国科学院计算技术研究所
发明人何清;吴新宇;庄福振;敖翔
代理机构北京律诚同业知识产权代理有限公司代理人祁建国;梁挥
摘要
本发明公开了一种大数据分类方法及系统,方法包括:训练步骤,将输入数据划分成输入数据块,将该输入数据块生成模式字符串的分类规则{模式字符串=>类标},并将该分类规则写入Hbase数据库规则表;测试步骤,读取该输入数据块,并构造待分类模式字符串,在该Hbase数据库规则表中查找与该待分类模式字符串匹配的分类规则,并输出分类结果。由此,提供一种基于超曲面的大数据分类方法及系统,通过采用基于超曲面的覆盖算法,能在Hadoop映射/化简编程框架和Hbase分布式非关系型数据库基础上实现,且能以较低的计算代价,构建易于解释的规则模型,快速高效处理海量数据,以应对现实世界中呈爆炸式增长的数据的分类需求。

专利服务由北京酷爱智慧知识产权代理公司提供