加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种数据分类的方法及装置

发明专利有效专利
  • 申请号:
    CN201010122141.2
  • IPC分类号:G06F17/30;G06F17/27;G06Q30/00
  • 申请日期:
    2010-03-09
  • 申请人:
    阿里巴巴集团控股有限公司
著录项信息
专利名称一种数据分类的方法及装置
申请号CN201010122141.2申请日期2010-03-09
法律状态授权申报国家中国
公开/公告日2011-09-21公开/公告号CN102193936A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;F;1;7;/;2;7;;;G;0;6;Q;3;0;/;0;0查看分类表>
申请人阿里巴巴集团控股有限公司申请人地址
英属开曼群岛大开曼岛资本大厦一座四层847号邮箱 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人阿里巴巴集团控股有限公司当前权利人阿里巴巴集团控股有限公司
发明人钟灵;刘华雷
代理机构北京同达信恒知识产权代理有限公司代理人郭润湘
摘要
本申请涉及数字处理领域,公开了一种商品分类的方法及装置,用于提高商品分类流程的执行效率。该方法为:获取需要进行分类的各商品的相关数据,并提取出其中的商品标题;对各商品标题分别进行分词划分,并确定各分词的权重,其中,各分词的权重用于表示该分词的历史出现频率;针对不同的商品分别选取权重取值符合预设条件的分词组成分词序列;将针对各商品选取的分词序列进行比较,并将分词序列相同的商品的相关数据进行合并。这样,大大减少了需要处理的商品相关数据的数量,可以在较短时间内迅速、准确地实现商品分类,从而有效提高了商品分类流程的执行效率,降低了商品相关数据的管理复杂度,也减轻了系统的运算负荷。

专利服务由北京酷爱智慧知识产权代理公司提供