加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种实现Hadoop文件处理的方法及装置

发明专利无效专利
  • 申请号:
    CN201410203430.3
  • IPC分类号:G06F17/30
  • 申请日期:
    2014-05-14
  • 申请人:
    浪潮(北京)电子信息产业有限公司
著录项信息
专利名称一种实现Hadoop文件处理的方法及装置
申请号CN201410203430.3申请日期2014-05-14
法律状态撤回申报国家中国
公开/公告日2014-08-06公开/公告号CN103970874A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0查看分类表>
申请人浪潮(北京)电子信息产业有限公司申请人地址
北京市海淀区上地信息路2号2-1号C栋1层 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人浪潮(北京)电子信息产业有限公司当前权利人浪潮(北京)电子信息产业有限公司
发明人辛国茂;赵仁明;房体盈;亓开元
代理机构北京安信方达知识产权代理有限公司代理人王丹;栗若木
摘要
本发明公开了一种实现Hadoop文件处理的方法及装置,包括:读取需要处理的分布式文件系统(Hadoop)的文本文件;逐行提取文本文件并转换为映射(Map)规约(Reduce)接受的数据类型的内容;逐行读取转换后的文本文件内容,以确定是否进行断行处理。本发明通过将读取的文本文件直接转换为MapReduce接受的数据类型的内容,逐行的对处理为断行的内容进行确定,节省了预处理过程中删除CR造成的耗时,且不需要额外占用磁盘空间。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供