加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于数据湖的异构数据源集成方法及装置

发明专利有效专利
  • 申请号:
    CN202010809326.4
  • IPC分类号:G06F16/27;G06F16/25
  • 申请日期:
    2020-08-12
  • 申请人:
    北京海致网聚信息技术有限公司
著录项信息
专利名称基于数据湖的异构数据源集成方法及装置
申请号CN202010809326.4申请日期2020-08-12
法律状态暂无申报国家中国
公开/公告日2020-11-20公开/公告号CN111966750A
优先权暂无优先权号暂无
主分类号G06F16/27IPC分类号G;0;6;F;1;6;/;2;7;;;G;0;6;F;1;6;/;2;5查看分类表>
申请人北京海致网聚信息技术有限公司申请人地址
北京市海淀区学院路甲5号2幢平房B-1011 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京海致科技集团有限公司当前权利人北京海致科技集团有限公司
发明人翟士丹
代理机构暂无代理人暂无
摘要
本发明公开了基于数据湖的异构数据源集成方法及装置,其方法包括如下步骤:a、根据用户调用写数据接口的信息,确定本次写请求的操作标示、数据、时间戳,其中操作标示包含追加、更新、删除三种类型,时间戳为写请求达到的时间,将以上信息追加写入到数据湖中的一个特定文件内;b、将上一步写入到特定文件内的数据,结合操作标示及时间戳做数据合并处理,得到最终的结果数据。本发明解决了现有数据湖数据集成技术,无法支持数据更新操作,不能将数据湖的数据和原始数据保持一致,不能有效解决大数据集群大量小文件导致查询性能低效等问题。

专利服务由北京酷爱智慧知识产权代理公司提供