【压力拉满】大数据开发面试题【Yarn篇】

45、介绍yarn

是一个集群资源管理器,主要由两个组件:RM和NMRM:负责整个集群的资源管理和调度,接收来自客户端程序提交的请求,根据资源进行分配,也负责监控集群中的资源使用情况NM:每个节点上运行运行一个NM,负责管理该节点上的资源,接收来自RM的指令,分配或者释放资源

46、yarn工作流程

1、用户通过客户端向RM提交应用程序2、RM根据可用资源和调度策略,为应用程序分配所需的资源3、每个节点上的NM接收来自RM的任务分配,并在该节点上启动和管理任务的执行4、RM和NM定期报告资源使用清除那个和任务状态

46、YARN有几个模块

1、RM2、NM3、ApplicationMaster:每个应用程序都有一个ApplicationMaster,是应用程序内部主管,与RM通信,协调应用程序的资源请求和任务执行,4、Container:封装了资源的概念,是yarn中任务运行的基本单位,RM将资源分配给应用程序管理器,会创建容器来运行应用程序的任务

补充:yarn资源调度机制

Hadoop的作业调度器有三种:FIFO、Capacity Scheduler和Fair Scheduler1、FIFO整个集群提交的作业都是用一个队列来进行服务,根据提交作业的顺序来运行,先来先服务2、容量调度器将整个集群的资源分为队列,每个队列之间的资源互不干扰,可分为生产和开发环境,且可以在每一个对队列里面使用FIFO调度策略3、Fair Scheduler(资源调度器)支持多个队列,每个队列配置一定的资源,每个队列中的job任务公平共享所在队列的所有资源,队列中的job任务都是按照优先级分配资源,优先级越高分配的资源越多,会公平保证每个job都会分配到资源

#23届找工作求助阵地##软件开发薪资爆料#
全部评论

相关推荐

#腾讯云智研发2025实习生招聘# 4.1笔试4.10一面4.17二面(本来应该是4.15,但是那天网络不太行推迟了)腾讯云智 数开实习面试凉经(回答的实在依托,我自己都受不了自己😅)自我介绍说下你的项目项目为什么要分不同的主题域项目各个分层是为了什么,为什么要分层order by sort by cluster by distribute by这几个算子的区别有一个表有userid login_time,统计用户最长连续登录天数,说说思路,然后有没有考虑过全量表下的场景数据倾斜怎么处理(给场景)数据加盐怎么做小文件为什么产生,怎么解决map joinzookeeper在大数据组件中的作用zookeeper存hadoop的元数据吗使用过哪些部署hadoop集群的方式使用什么管理hadoop集群如果有一个报表,某个数值异常或者发现错误,如何进行排查,然后如果是数据源有问题,从几百个源表中如何快速定位到出问题的表突然某一天,某个工作流执行的时间比往常慢了,如何排查,如何解决熟悉哪些编程语言有没有通过Java编写过udf函数,udf函数需要实现哪些方法udaf函数和udtf函数介绍下区别(从输入和输出角度)处理过流数据吗流处理如何保证数据一致性,如何保证数据不丢失介绍下自己的优缺点怎么看待大模型你觉得你有哪些优势在刚刚的提问中没有展现出来,你可以展示下反问环节没有手撕环节只记得大概这么多了,没按顺序,凉透了 好多问题答不上来,太菜了😭,面试官很漂亮,人也真的很好二面更新了解了下学校课程,深挖项目,出了几个场景题,我回答得很一般,不过从问题中确实学到了很多,以前只会背的一些知识突然就理解了,面试真能带来进步啊。面试官依然很好,很友好,问题也很清楚,生怕你不知道在问什么,给你解释得清清楚楚不愧是大厂#数据人的面试交流地# #数据人offer决赛圈怎么选# #牛客创作赏金赛# #牛客AI配图神器#
查看72道真题和解析 数据人的面试交流地
点赞 评论 收藏
分享
评论
6
14
分享

创作者周榜

更多
牛客网
牛客企业服务