1. 简历深挖2. mysql binlog了解吗3. shell脚本写过吗4. 两个集群,一张hive表如何进行数据共享,A集群如何同步到B集群中5. 一张订单表,支付状态会发生变化,如何采集到ods?面试官说由于每张mysql表都是在系统上有应用的,所以应该用update的方式更新支付状态,不能采用数仓的方式去思考问题,不能用拉链表。数仓可以保存历史数据,但是mysql表必须要用update的方式,不然在系统上数据会显示错误。用户角度:如果数据状态没有更新就会出现,用户界面就会显示未支付。6. sql执行流程7. 数据倾斜,9999w条id为1的数据,如何处理数据倾斜问题8. 数仓的分层9. hadoop是什么10. spark和mapreduce的应用场景。11. 三个sql题第一道:b left join a表的返回结果是什么a:id name1 a1 a2 b3 eb:id name1 a1 a2 b第二道:忘了,简单的累计开窗函数第三道:列转行tab:t_1 t_2 t_3a c 1a d 2a e 3a c 4a d 5a e 6结果表t_1 res_2 res_3 res_4a 1 2 3b 4 5 6select t_1 ,max(case when t_2 = 'c' then t_3 end) as res_2 ,max(case when t_2 = 'd' then t_3 end) as res_3 ,max(case when t_2 = 'e' then t_3 end) as res_4from tab group by t_1#滴滴##滴滴实习##滴滴数据开发#