加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种数据去重的方法

发明专利有效专利
  • 申请号:
    CN202111115705.4
  • IPC分类号:G06F16/215;G06F16/2455
  • 申请日期:
    2021-09-23
  • 申请人:
    世纪龙信息网络有限责任公司
著录项信息
专利名称一种数据去重的方法
申请号CN202111115705.4申请日期2021-09-23
法律状态公开申报国家中国
公开/公告日2021-11-26公开/公告号CN113704240A
优先权暂无优先权号暂无
主分类号G06F16/215IPC分类号G;0;6;F;1;6;/;2;1;5;;;G;0;6;F;1;6;/;2;4;5;5查看分类表>
申请人世纪龙信息网络有限责任公司申请人地址
广东省广州市天河区龙口中路211号华天国际广场东苑1、2层 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人世纪龙信息网络有限责任公司当前权利人世纪龙信息网络有限责任公司
发明人唐微微;王刚;马幸晖;丁嘉嘉;黄开发;王家宾
代理机构北京集佳知识产权代理有限公司代理人刘思言
摘要
本申请公开了一种数据去重的方法。本申请可按顺序逐行读取待检测数据;计算当前读取的目标行数据的MD5值并利用hash算法计算目标行数据的索引文件块的目标块号。判断是否存在目标块号的索引文件块;若是,则判断是否存在与目标块号的索引文件块对应的二级跳表索引文件块;若不存在,则检索目标块号的索引文件块是否存在目标行数据的MD5值;若目标块号的索引文件块存在目标行数据的MD5值,则删除目标行数据。因每行数据的MD5值的存储空间小于每行数据的存储空间,去重时,仅读取每行数据的MD5值来进行数据比对便可判断目标数据是否存在,不用读取每行数据,减轻服务器运行压力,节约服务器资源,提升了数据去重的速度。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供