1、项目2、sql(近30日完单天数,查询近7天内最近一单的上一单是取消单的,近7天完单量top5的司机3、map和reduce的数量是由什么决定的4、hive的元数据包含哪些内容5、union all 和 union区别6、四种排序的区别(order by,sort by,distribute by,cluster by7、对于维度建模的理解8、对于缓慢变化维的理解(个人回答的拉链表9、拉链表的构建方式10、spark有哪些聚合类的算子11、如何理解shuffle12、反问总结:整体难度不大,项目问的不深。两道sql难度适中,面试官人很好,sql会带你一步一步的思考。整个八股部分答得还可以,但是sql写的比较差,主要是对于题目的理解有一些问题。面试后第二天通知通过,约了二面(二面已挂,后续再发