大数据技术关键分析
沉沙 2018-10-17 来源 : 阅读 1302 评论 0

摘要:本篇教程探讨了大数据技术关键分析,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。

本篇教程探讨了大数据技术关键分析,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。

<

  古代,人们用牛来拉重物,当一头牛拉不动一根圆木时,他们不曾想过培育更大更壮的牛。同样,在面对计算能力不足时,我们也应尝试着结合使用更多的计算机系统。

  Hadoop就是基于这样的理念设计。Hadoop是一个由Apache基金会所开发的分布式系统基础架构,计算分析处理所涉及的框架,允许多台设备一起工作,充分利用集群的威力进行高速运算和存储,共同完成一项任务,而对于用户来说这些设备是感知不到了,Hadoop技术屏蔽了底层的细节。


  Hadoop最底层是HDFS,也就是Hadoop文件系统,这个是分布式文件系统,由多台设备提供统一的存储空间,而用户感觉不到多台设备,只看到一个统一的存储空间,这也是云存储技术的基础。构建于HDFS的Hbase是天然的分布式数据库;MapReduce提供了云计算框架,它的数据来源也是分布式的,可以是HDFS,也可以是Hbase。

  HBase是分布式数据产品,多台设备共同提供类似数据库的服务,但是这种服务是分布式,由多台设备来提供的,用户也完全感觉不到设备的存在,只知道有一个数据库给他们服务。这个也就是大数据库的基础。

  在HBase之上,有MapReduce服务框架,也就是并行分析计算服务框架,可以支持各种分析应用并发的在多台设备上执行,完成一个共同的任务,原来1个人需要10天完成的任务,现在可以10个人1天完成,大大提升了数据分析的效率,这个也就是分布式计算的基础。

  Pig、Hive等是数据分析的引擎,提供快速的数据分析接口和能力。

  Hadoop主要有以下几个优点:

  一是高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖。

  二是高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中。

  三是高效性。Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。

  四是高容错性。Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。

  五是低成本。与一体机、商用数据仓库以及QlikView、Yonghong Z-Suite等数据集市相比,hadoop是开源的,项目的软件成本因此会大大降低。      
          

本文由职坐标整理发布,学习更多的大数据技术相关知识,请关注职坐标大技术云计算大技术技术频道!

本文由 @沉沙 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved

208小时内训课程