大数据技术 Hadoop的优缺点
沉沙 2018-09-21 来源 : 阅读 1729 评论 0

摘要:本篇教程探讨了大数据技术 Hadoop的优缺点,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。

本篇教程探讨了大数据技术 Hadoop的优缺点,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。

<

百亿数量级的大数据项目,软硬件总体预算只有30万左右,需求是进行复杂分析查询,性能要求多数分析请求达到秒级响应。 
             
      遇到这样的项目需求,预算不多的情况,似乎只能考虑基于Hadoop来实施。 
      理论上Hadoop撑住百亿数量级没问题,但想要秒级响应各种查询分析就不行了。我们先大概分析一下Hadoop的优缺点。 
      Hadoop 
             
      Hadoop目前几乎是大数据的代名词,很多企业都基于Hadoop搭建自己的大数据业务。 
             以下是Hadoop的主要优点: 
             1. 
      Hadoop集群的扩展性是其一大特点,Hadoop可以扩展至数千个节点,对数据持续增长,数据量特别巨大的需求很合适。 
             2. 
      Hadoop的成本是其另一大优势,由于Hadoop是开源项目,而且不仅从软件上节约成本,硬件上的要求也不高。目前去IOE潮流风行,低成本的Hadoop也是一大推手。 
      
             3. Hadoop生态群活跃,其周边开源项目丰富,HBase, 
      Hive,Impala等等基础开源项目众多。 
             那么Hadoop的不足有哪些呢? 
             Hadoop不适合做实时分析系统。 
             1. 从通讯层的技术上来说有如下原因: 
             ?    
      任务分配Server不会将信息Push到计算Node,而是让计算Node通过心跳去Pull任务。 
             ?    
      基于框架的通用性,MapReduce代码也会在HDFS中传送,在各计算Node展开,再通过启动新JVM进程装载并运行。 
             ?    
      类似的JVM进程启停有5、6次之多。 
             ?    Reduce 
      Task只能在全部Map Task完成之后才能启动。 
             2. 缺乏专业的支持服务 
             
      因为是开源项目,缺少专业的商业支持服务,公司需要储备专业Hadoop知识的专家来保证系统的正常运转。 
             3. Hadoop可以支持百亿的数据量,但很难应对秒级响应的需求 
      
             即使是数亿的数据量,Hadoop也只适合做分钟级别的离线分析系统。 
          

本文由职坐标整理发布,学习更多的大数据技术相关知识,请关注职坐标大技术云计算大技术技术频道!

本文由 @沉沙 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式AI+学习就业服务平台 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved