面过阿里(拿到意向书)、网易(无情拒绝)、海康,问题都总结一块了分不出来哪个公司问的了(见谅)。。。 (1)spark运行流程、源码架构 (2)Hbase主键设计、hbase为啥比mysql快、为什么项目选用hbase (3)Hbase读写流程,数据compact流程 (4)Hadoop mapreduce流程 (5)Spark standalone模型、yarn架构模型(画出来架构图) (6)Spark算子(map、flatmap、reducebykey和reduce、groupbykey和reducebykey、joi...