2022-01-02 00:28 已编辑汇丰软件_WPB_中级软件开发工程师

关注

<span>Spark StandAlone模式和On Yarn模式搭建</span>

Spark StandAlone模式和On Yarn模式搭建

Spark StandAlone模式

上传并解压

tar -zxvf spark-3.0.2-bin-hadoop3.2.tgz -C /data/soft/

修改配置文件

# 进入conf文件夹目录
cd /data/soft/spark-3.0.2-bin-hadoop3.2/conf

spark-env.sh

# 修改文件名
mv spark-env.sh.template spark-env.sh
# 修改spark-env.sh
vi spark-env.sh 

export JAVA_HOME=/usr/local/jdk1.8
export SPARK_MASTER_HOST=bigdata01

slaves

mv slaves.template slaves
vi slaves

# 配置bigdata02/bigdata03为从节点
bigdata02
bigdata03

分发

scp -r /data/soft/spark-3.0.2-bin-hadoop3.2/ root@bigdata02:/data/soft/

启动集群

sbin/start-all.sh

启动完毕后, 使用jps命令，在主节点bigdata01上可以看到master进程，在从节点bigdata02/bigdata03上可以看到worker进程。

Web UI测试

Spark Web UI http://bigdata01:8080/

测试

./bin/spark-submit  --class org.apache.spark.examples.SparkPi --master spark://bigdata01:7077 examples/jars/spark-examples_2.12-3.0.2.jar 2

停止集群

sbin/stop-all.sh

Spark on Yarn 模式

上传并解压

tar -zxvf spark-3.0.2-bin-hadoop3.2.tgz -C /data/soft/

修改配置文件

# 进入conf文件夹目录
cd /data/soft/spark-3.0.2-bin-hadoop3.2/conf

Spark-env.sh

# 修改文件名
mv spark-env.sh.template spark-env.sh
# 修改spark-env.sh
vi spark-env.sh 

export JAVA_HOME=/usr/local/jdk1.8
export HADOOP_CONF_DIR=/data/soft/hadoop-3.2.0/etc/hadoop

测试

提交测试任务

bin/spark-submit --class org.apache.spark.examples.SparkPi --master yarn --deploy-mode cluster examples/jars/spark-examples_2.12-3.0.2.jar 2

去Yarn上查看任务状态

总结

Standalone：独立集群模式适合学习过程。

On Yarn 共用Hadoop集群资源推荐使用

参考文档

Spark官方文档

全部评论

推荐最新楼层

昨天 10:01

阿里云_JAVA研发工程师(准入职员工)

阿里云内推，阿里云内推码

产品岗真实工作体会~ 我所在的产品线整体风格不卷，加班不严重，周末大家都安排自己的生活，可以安心放下手机，也让我彻底放下“不秒回羞耻症” 阿里云团队规模太大，分工很细，人也很多，想搞清楚一件事情要对接好多好多人，要熟悉的流程也贼多，这个过程的确有些累，但我估计只要在大厂都会这样 感觉这边做事情自由度更高，换句话说，老板只要结果，过程怎么做自己想办法去 凡事凡人都爱讲价值。初次对接的其他部门的同事，也会直接问我，“你对业务的价值是什么” 目前线上线下接触到的同事估计有四五十个，99%交流都顺畅，有话都直说 这一个月约了不少coffee talk，即使没有直接的工作关联，大家还都挺热心解答我各种疑...

阿里云工作强度 693人发布

点赞评论收藏

11-30 14:05

已编辑

上海交通大学算法工程师

网关为什么用Nginx？

面试题简述为什么大多数网关都选择Nginx？它到底解决了哪些问题？面试官想听的1、是否理解Nginx的作用；2、是否能从架构层面讲出为什么不用tomcat，不用Node.js。3、能否结合项目说出具体使用场景。面试回答举例Nginx的核心价值是高性能和高并发。它基于 epoll 的事件驱动模型，可以在单机上轻松支持几万 QPS。详细内容可跳转该链接查看详情：http://xhslink.com/o/1mNTBH9E2mI由浅入深分析1、反向代理：隐瞒真实服务，提升安全性。2、负载均衡：Round Robin，IP Hash，权重等策略。3、高性能架构：异步非阻塞 IO + 事件驱动。4、扩展性...

2025八股文复盘

点赞评论收藏

11-19 17:28

济南大学 Java

实习同事笑死我了

他也是实习生，与前端同事对接，他给出对于这个问题的想法，前端就只回了一个“？”，或者跟她说修改哪里就只回一个“1”，跟我这个实习同事交流不超过4个字，那个前端也是一个二十三四岁的感觉，笑死了

凸守：0101010101

职场中那些令人叹为观止的...

点赞评论收藏

11-16 20:07

门头沟学院 Java

大三，双非，想实习，求建议

大一、大二傻傻的，一直跟着学校走，今年7月初刷到优雅的视频才开始醒悟。学到了微服务、rocketmq，优雅的入门路线只有jvm没看，其他看完了，跟敲了点评和外卖。最近一直在背八股（redis一点没看、jvm、juc没看完、javase、集合、mysql看完了）、准备项目。项目真的不知道要怎么学，感觉自己学得很浅、很表面，不知道学到什么程度才能去面试，有必要把代码抄一遍吗？我也想进步，想进中大厂，想秋招拿offer

在看牛客的铁锤很谦虚：这个学校在牛客还是挺多的hh

点赞评论收藏

12-01 22:32

门头沟学院 Java

「黑马点评」——新手项目实战的黄金跳板

虽然这个项目早就烂大街但如果你什么实习都没有，也没啥项目，不想出钱的话，想做后端java，真的很推荐学习上手黑马点评，它介绍很多后端技术，结构清晰、含金量高且完全免费的练手项目「黑马点评」并不是某个商业产品，也没上线，而是国内知名IT教育机构“黑马程序员”为配套 Redis 教学而精心设计的一个仿美团点评的H5应用项目。它虽小，却五脏俱全；看似简单，实则暗藏玄机，技术大大的它的核心魅力在于：用一个贴近真实业务的场景，把 Redis 的主流高级特性全部串了起来。项目亮点：Redis 技术的集大成者在这个项目中，你可以亲手实现以下高价值功能，每一项都是面试高频考点：基于 Redis 的短信登录 +...

一人推荐一个值得做的项目

点赞评论收藏

全站热榜

华为开奖交流

热聊中

创作者周榜

正在热议

# 高薪高压 vs 低薪wlb，你怎么选？ #