加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于Hadoop的海量非独立小文件关联存储方法

发明专利无效专利
  • 申请号:
    CN201110312671.8
  • IPC分类号:G06F17/30
  • 申请日期:
    2011-10-15
  • 申请人:
    西安交通大学
著录项信息
专利名称一种基于Hadoop的海量非独立小文件关联存储方法
申请号CN201110312671.8申请日期2011-10-15
法律状态撤回申报国家中国
公开/公告日2012-01-25公开/公告号CN102332027A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人西安交通大学申请人地址
陕西省西安市咸宁西路28号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人西安交通大学当前权利人西安交通大学
发明人郑庆华;董博;刘均;马瑞;宋凯磊
代理机构西安通大专利代理有限责任公司代理人朱海临
摘要
本发明公开了一种基于Hadoop的海量非独立小文件关联存储方法,主要解决海量的非独立小文件存取效率和读取效率较低的问题。针对某个大文件被分割成的许多小文件,即非独立小文件,本发明的特征在于:(1)将属于某个大文件的所有小文件归并为一个文件,称为mergedfile;(2)对每个mergedfile建立一个局部索引,并在上传时将局部索引文件与文件实体一同存放在Hadoop系统的DataNode上;(3)在读取非独立小文件时,采用元数据缓存、局部索引文件预取和关联文件预取提高文件的读取效率。通过以上方法,提高了现有Hadoop系统存储小文件的存储效率和读取效率。本发明适用于通用场景下海量的非独立小文件的存储和管理。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供