加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种确定数据样本类别的方法及其系统

发明专利有效专利
  • 申请号:
    CN200910077994.6
  • IPC分类号:G06F9/38;G06F9/46
  • 申请日期:
    2009-02-06
  • 申请人:
    中国移动通信集团公司
著录项信息
专利名称一种确定数据样本类别的方法及其系统
申请号CN200910077994.6申请日期2009-02-06
法律状态暂无申报国家中国
公开/公告日2010-08-11公开/公告号CN101799748A
优先权暂无优先权号暂无
主分类号G06F9/38IPC分类号G;0;6;F;9;/;3;8;;;G;0;6;F;9;/;4;6查看分类表>
申请人中国移动通信集团公司申请人地址
江苏省苏州市高新区科灵路78号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中移(苏州)软件技术有限公司,中国移动通信有限公司研究院,中国移动通信集团公司当前权利人中移(苏州)软件技术有限公司,中国移动通信有限公司研究院,中国移动通信集团公司
发明人徐萌;邓超;高丹;罗治国;周文辉;何清;庄福振;郑诗豪;沈亚飞;陈磊
代理机构北京同达信恒知识产权代理有限公司代理人魏杉
摘要
本发明公开了一种确定数据样本的类别的方法及其系统。本发明方法包括:并行执行多个第一Map任务,其中,每个Map任务获取待分类数据样本集中的部分数据样本,计算该部分数据样本中每个数据样本与训练样本集中的训练样本的相似度,并针对每个数据样本取降序排序的前K个相似度所对应的类别;执行Reduce任务,所述Reduce任务分别对每个数据样本的K个相似度所对应的类别进行汇总,将每个数据样本中占多数的类别确定为该数据样本的类别。采用本发明,可提高数据样本分类处理的效率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供