大数据技术 实现从Oracle增量同步数据到GreenPlum
沉沙 2018-10-11 来源 : 阅读 4529 评论 0

摘要:本篇教程探讨了大数据技术 实现从Oracle增量同步数据到GreenPlum,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。

本篇教程探讨了大数据技术 实现从Oracle增量同步数据到GreenPlum,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。

<

简介:
  GreenPlum是一个基于PostgreSQL数据库开发的MPP架构的数据库仓库,适用于OLAP系统,支持50PB(1PB=1000TB)级海量数据的存储和处理。
 
背景:
  目前有一个业务是需要将Oracle数据库中的基础数据增量同步到GreenPlum数据仓库,便于进行数据分析和处理。
 
规模:
  每天产生60G左右数据,最大的表每天新增上亿条数据。
 
解决方法:
  1)历史数据通过抽取导入的方式进行初始化。
  2)增量更新数据:
  使用GoldenGate将Oracle日志解析,传给GreenPlum所在的节点。
  GreenPlum节点通过程序将GoldenGate解析的日志记录增量同步到GreenPlum数据库仓库中。
 
 
最终结果:
  1.初始化数据一次大概三天时间,初始化5T左右数据。
  2.增量同步数据延时不超过3个小时。
  3.GreenPlum性能经过优化后,比在Oracle数据库上查询要快10~100倍(GreenPlum的机器配置相对要低很多)。
  4.对部分大表进行了压缩处理,会减少存储的空间和I/O的开销。
  5.没有使用列式存储,大表的列太多,对于不适合做列式存储,仅进行了压缩。
  6.对部分表的分布键进行了调整,极大的提升了数据分析的效率。
   

本文由职坐标整理发布,学习更多的大数据技术相关知识,请关注职坐标大技术云计算大技术技术频道!

本文由 @沉沙 发布于职坐标。未经许可,禁止转载。
喜欢 | 4 不喜欢 | 2
看完这篇文章有何感觉?已经有6人表态,67%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式AI+学习就业服务平台 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved