视频面了50分钟左右 主要是围绕针对做的项目问我的,记不太清 1.spark和hadoop的区别 2.为什么选用spark on yarn这种运行模式。 3.hadoop ha架构 4.hadoop ha当一个namenode挂掉。会有数据丢失吗。如果有,有什么解决方法。 5.spark三种运行模式 6.sql,选出每个班级每个科目最高成绩的那个学生 7.一个有序数组,最优方式找出想要的数 还有好多记不太清了,看到有个同学求大数据面经就随便写了点,8.3号视频面试的