加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种数据抽取方法及装置

发明专利有效专利
  • 申请号:
    CN201410406481.6
  • IPC分类号:G06F17/30
  • 申请日期:
    2014-08-18
  • 申请人:
    浪潮(北京)电子信息产业有限公司
著录项信息
专利名称一种数据抽取方法及装置
申请号CN201410406481.6申请日期2014-08-18
法律状态授权申报国家中国
公开/公告日2014-12-03公开/公告号CN104182502A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人浪潮(北京)电子信息产业有限公司申请人地址
北京市海淀区上地信息路2号2-1号C栋1层 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人浪潮(北京)电子信息产业有限公司当前权利人浪潮(北京)电子信息产业有限公司
发明人曹连超;辛国茂;亓开元;刘伟;李占强;卢军佐
代理机构北京安信方达知识产权代理有限公司代理人王丹;李丹
摘要
本发明提供一种数据抽取方法,应用于关系型数据库,所述方法包括:根据选取的数据表中某字段的值域分布,将所述数据表分成M个数据分区,所述字段的类型为数值型或者所述字段的值能够转换成数值;根据所述各数据分区的数据行数计算所述各数据分区的权重;根据所述各数据分区的权重为所述各数据分区分配线程数;所述各数据分区分配的各线程数的总和等于预设的总线程数N,其中M≤N;开启N个线程,按照所分配的线程数,分别对所述各数据分区采用相应数量的线程进行数据抽取。本发明通过对将数据表分为若干数据分区,动态分配各数据分区的线程数,解决了各线程分配数据不均匀的问题,提高了关系型数据的数据抽取效率。

专利服务由北京酷爱智慧知识产权代理公司提供