一面 自我介绍 说下Hadoop吧 Spark任务执行流程 了解Yarn吗 了解Zookeeper吗 Hive的作用 数据库你都了解哪些内容 一道SQL:一个表,每门课选成绩最好的三个学生 编程说思路:1G文件,每行是一个词,内存1M,求词频最大的前100个词 编程:求前K大的数 (我问能import heapq吗,面试官说算了你说下思路就行……) 二面 自我介绍 Java抽象类和接口的区别 如何处理数据倾斜 编程:m*n的矩阵,初始位置(x, y),只能用中国象棋马的走法,走过的位置不能再走,能否遍历矩阵 编程:输入二叉树,输出平衡二叉树 三面 自我介绍 spark任务执行流程(又一遍)...