大数据技术 YARN入门学习
沉沙 2018-09-29 来源 : 阅读 1754 评论 0

摘要:本篇教程探讨了大数据技术 YARN入门学习,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。

本篇教程探讨了大数据技术 YARN入门学习,希望阅读本篇文章以后大家有所收获,帮助大家对大数据技术的理解更加深入。

<


Apache Hadoop YARN
YARN的主要功能包括:资源管理和任务调度及监控,它们各自都是独立的守护进程。要实现这个目标,必须有一个全局的资源管理器和每个应用都有一个ApplicationMaster(AM)。应用可以是单个job,也可以是DAG jobs。
ResourceManager和NodeManager组成数据计算框架。ResourceManager对系统中所有应用的资源拥有最终仲裁权。NodeManager对容器负责,监控它们的资源使用情况,并且将其报告给ResourceManager。
每个应用都有一个ApplicationMaster,它负责向ResourceManager申请资源,并且和NodeManager一起指向和监控任务。



在这幅图中,有两个客户端都提交了任务,可以看到NodeManager向ResourceManager报告,ApplicationMaster向Resource申请资源并且监控任务执行。
 
ResourceManager有两个主要的组件:Scheduler和ApplicationManager
Scheduler负责分配资源
ApplicationManager负责接受提交的任务,并且分配第一个container为了执行特定的ApplicationMaster。每个应用的ApplicationMaster负责向Scheduler申请适量的资源,并且跟踪资源的状态和监控进度。
 
总结一下:
1、ResourceManager包括Scheduler和ApplicationManager
2、ResourceManager负责集群中所有应用的资源分配(资源包括内存、CPU、磁盘、网络等等)
3、Scheduler只是一个单纯的调度器,负责给不同的应用分配资源
4、每个应用都有一个ApplicationMaster,它负责向ResourceManager申请资源,并且跟踪资源的使用情况还有任务的执行情况
5、NodeManager负责运行并且管理本节点的容器(资源)。AppMaster指定容器来运行任务。(也就是说任务是在容器中运行的)



 
所以,任务的执行是这样的:
1、客户端提交任务到ResourceManager
2、ApplicationManager接收任务,并且指定一个NodeManager给它分配第一个资源(container)用户执行ApplicationMaster
3、NodeManager启动一个ApplicationMaster
4、AppicationMaster向ResourceManager申请资源(PS:其实是向Scheduler申请),并且监控资源的使用情况,监控任务的执行进度
5、任务开始执行
 
总的来说,AppMaster负责协调并监控资源,NodeManager负责管理本地资源,启动/停止任务
 
   

本文由职坐标整理发布,学习更多的大数据技术相关知识,请关注职坐标大技术云计算大技术技术频道!

本文由 @沉沙 发布于职坐标。未经许可,禁止转载。
喜欢 | 0 不喜欢 | 0
看完这篇文章有何感觉?已经有0人表态,0%的人喜欢 快给朋友分享吧~
评论(0)
后参与评论

您输入的评论内容中包含违禁敏感词

我知道了

助您圆梦职场 匹配合适岗位
验证码手机号,获得海同独家IT培训资料
选择就业方向:
人工智能物联网
大数据开发/分析
人工智能Python
Java全栈开发
WEB前端+H5

请输入正确的手机号码

请输入正确的验证码

获取验证码

您今天的短信下发次数太多了,明天再试试吧!

提交

我们会在第一时间安排职业规划师联系您!

您也可以联系我们的职业规划师咨询:

小职老师的微信号:z_zhizuobiao
小职老师的微信号:z_zhizuobiao

版权所有 职坐标-一站式AI+学习就业服务平台 沪ICP备13042190号-4
上海海同信息科技有限公司 Copyright ©2015 www.zhizuobiao.com,All Rights Reserved.
 沪公网安备 31011502005948号    

©2015 www.zhizuobiao.com All Rights Reserved