Spark运行架构

标准Master-slave结构 spark框架有两个主要的组件,就是Driver和Executor。

Driver[驱使整个应用运行起来的程序]

1.执行spark任务中的main方法,负责实际代码的执行工作; 2.将用户提交的应用转化为job作业; 3.在Executor之间调度Task任务; 4.跟踪Executor的执行情况; 5.通过webUI查看作业运行情况

Executor[worker节点中的一个JVM进程][计算节点]

1.负责spark作业中具体Task任务的运行,并将结果返回给Driver进程 2通过自身的Block Manager块管理器为用户提交的应用中要求缓存的RDD提供内存式存储,由于RDD是直接缓存在Executor进程中的,所以任务运行期间可充分利用缓存数据加速计算。

Spark构建在Yarn之上,提交应用程序时应该要包括ApplicationMaster;RM和Driver之间靠ApplicationMaster解耦。 alt

有向无环图(DAG)

alt

基于YARN环境spark用户应用提交流程:

alt

全部评论

相关推荐

诨号无敌鸭:恭喜佬,但是有一个小问题:谁问你了?我的意思是,谁在意?我告诉你,根本没人问你,在我们之中0人问了你,我把所有问你的人都请来 party 了,到场人数是0个人,誰问你了?WHO ASKED?谁问汝矣?誰があなたに聞きましたか?누가 물어봤어?我爬上了珠穆朗玛峰也没找到谁问你了,我刚刚潜入了世界上最大的射电望远镜也没开到那个问你的人的盒,在找到谁问你之前我连癌症的解药都发明了出来,我开了最大距离渲染也没找到谁问你了我活在这个被辐射蹂躏了多年的破碎世界的坟墓里目睹全球核战争把人类文明毁灭也没见到谁问你了
点赞 评论 收藏
分享
听说改名字就能收到offer哈:Radis写错了兄弟
点赞 评论 收藏
分享
点赞 收藏 评论
分享
牛客网
牛客企业服务