因为一些原因整个面试跨过了七个小时(比如公寓着火了?????) 一面 自我介绍 进程与线程 spark rdd介绍一下 spark的懒依赖和宽依赖 100亿个数怎么求中位数 数组求top k 一道sql题 分组求每组top 3 二面 自我介绍again 二叉树的后序遍历 非递归实现 mapreduce介绍一下 mapreduce中间有个combine是干嘛的,有什么好处,有什么使用限制吗 拿mapreduce join两个表 说一下流程 hdfs小文件过多会怎么样 s...