加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

Hadoop分布式文件系统数据文件的生命周期管理方法和设备

发明专利有效专利
  • 申请号:
    CN201210406635.2
  • IPC分类号:G06F17/30
  • 申请日期:
    2012-10-23
  • 申请人:
    阿里巴巴集团控股有限公司
著录项信息
专利名称Hadoop分布式文件系统数据文件的生命周期管理方法和设备
申请号CN201210406635.2申请日期2012-10-23
法律状态授权申报国家中国
公开/公告日2014-05-07公开/公告号CN103778148A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人阿里巴巴集团控股有限公司申请人地址
英属开曼群岛大开曼资本大厦一座四层847号邮箱 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人阿里巴巴集团控股有限公司当前权利人阿里巴巴集团控股有限公司
发明人熊佳树
代理机构北京鑫媛睿博知识产权代理有限公司代理人龚家骅
摘要
本申请实施例公开了一种Hadoop分布式文件系统数据文件的生命周期管理方法和设备,在当前所存储的元数据中分离叶子目录,将相应文件大小的属性赋予叶子目录,并根据各叶子目录的业务时间进行归一化处理,得到归一化目录,然后,根据各归一化目录中所包含的业务时间数据和文件大小数据,确定各所述归一化目录所属的类型,并根据预设的生命周期管理策略,对各类型的归一化目录进行相应的数据处理,从而将数据的业务时间的概念引入数据存储和管理过程中,解决了在现有的生命周期管理过程中需要针对不同类型和级别的数据进行大规模数据标识,所带来的巨大数据处理量,同时有效的利用了数据文件自身的时间属性提升了数据处理的效率,最终解决了分布式文件系统的数据文件属性标识以及生命周期管理问题。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供