1、自我介绍 2、讲下印象深刻的项目 3、在项目中主要负责那些部分、遇到最大的困难是什么 4、MR的整个过程 5、发生了数据倾斜怎么处理 6、map join 为什么能解决数据倾斜 7、两个表都很大怎么去解决数据倾斜 8、Hadoop和spark的区别是什么 9、spark计算的灵活性体现在哪里 10、宽依赖和窄依赖的区别是什么 11、哪些算子是窄依赖、宽依赖 12、Object类都有哪些方法 13、hashcode函数的作用是什么 14、哈希冲撞有哪些解决办法 15、Java中int的取值范围是多少?有多少位?为什么是2*31-1?为什么是31次方不是32次方? 16、计算机中源码、反码、补...