金山云(已OC)
自我介绍
项目
Spark执行流程
Spark宽窄依赖算子
Spark shuffle的中间数据存储方式(这部分我没有了解直接跳了,后面查资料了解到时存算分离,RSS那套,可以了解一下字节开源的CSS)
RDD的存储级别(我就只答出来三种,实际好像是六种还是七种)
HDFS的读写流程
反转链表
没得反问
二面
介绍一下Spark
Spark执行流程
是否看过Spark源码
修改过源码的哪一部分
算法:BFS
是否看过操作系统,数据结构,计组等
反问
自我介绍
项目
Spark执行流程
Spark宽窄依赖算子
Spark shuffle的中间数据存储方式(这部分我没有了解直接跳了,后面查资料了解到时存算分离,RSS那套,可以了解一下字节开源的CSS)
RDD的存储级别(我就只答出来三种,实际好像是六种还是七种)
HDFS的读写流程
反转链表
没得反问
二面
介绍一下Spark
Spark执行流程
是否看过Spark源码
修改过源码的哪一部分
算法:BFS
是否看过操作系统,数据结构,计组等
反问
相关推荐