1、先是自我介绍,然后手撕一道SQL,面试官人很好,在引导我做2、讲讲Hadoop的架构3、HADOOP三个副本如何存储4、YARN怎么进行资源调度5、YARN里除了resourcemanage,还有一个什么?6、NodeManager的作用是什么?7、Mapreduce是一个计算引擎,聊一聊你了解的Mapreduce8、Spark和MP的差异,除了基于内存计算和基于磁盘计算的区别以外9、比如两者在shuffle阶段有什么差异?10、了解过数据倾斜吗,具体怎么解决?11、学习大数据是怎么学的?12、大数据挑战赛做什么?13、操作系统 物理内存有2G,但是能跑一个4G的程序,是怎么跑起来的?14...