摘要:本篇教程探讨了大数据技术 Hadoop初步学习,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。
本篇教程探讨了大数据技术 Hadoop初步学习,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。
<
What Is Apache Hadoop?
Hadoop是一个可靠的、可扩展的、分布式计算的开源软件。
Hadoop是一个分布式处理大数据的框架。它被设计成从一台到上千台不等的服务器,每个服务器都提供本地计算和存储的能力。它并非依赖于硬件来提供高可用服务。
Hadoop这个工程包含如下模块:
Hadoop Common:公共模块
Hadoop Distributed File System (HDFS™):分布式文件系统
Hadoop YARN:一个任务调度和集群资源管理的框架
Hadoop MapReduce:一个机遇YARN的系统,用于并行处理大数据
其它相关的工程还包括:
HBase:一个弹性的、分布式的数据库,支持结构化的数据存储
Hive:一个数据仓库的基础设施,提供数据汇总和查询
Spark:一个快速、通用的计算引擎。Spark提供简单并且有表现力的程序模块以支持大范围的应用,包括ETL、机器学习、流处理和图计算
Zookeeper:为分布式应用提供一个高性能的协调服务
本文由职坐标整理发布,学习更多的大数据技术相关知识,请关注职坐标大技术云计算大技术技术频道!
您输入的评论内容中包含违禁敏感词
我知道了
请输入正确的手机号码
请输入正确的验证码
您今天的短信下发次数太多了,明天再试试吧!
我们会在第一时间安排职业规划师联系您!
您也可以联系我们的职业规划师咨询:
版权所有 职坐标-一站式IT培训就业服务领导者 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
沪公网安备 31011502005948号