1、 自我介绍 2、 说一下学了哪些专业课 3、 数据开发相关的技术组件了解哪些 4、 Spark用的是哪个版本 5、 项目相关,spark处理逻辑 6、 spark和hadoop的区别 7、 shuffle做了什么操作,shffule的目的是什么 8、 spark怎么实现shffle的。答了基于hash的方式 9、 spark比较早的版本是基于hash实现shuffle的,新的版本是怎么实现shuffle的。 10、java的回收机制,内存模型 11、java8中lambd...