1、结合简历自我介绍 2、上来先来个MR流程 3、Spark和MR区别 4、Spark Shuffle和MR Shuffle对比 5、Spark Streaming的理解,和Spark Core的区别 6、场景题:Spark Streaming消费Kafka数据的时候,如果Spark集群挂了, 如何保证数据不丢不重 7、Spark运行时架构 8、Spark Job划分、任务调度细节 9、Spark Streaming和Flink的区别 10、问项目,数仓分层、建模模型 11、实际如何建模,结合项目介绍一下...