机器想学习 level
获赞
26
粉丝
20
关注
34
看过 TA
506
中国地质大学(北京)
2025
数据库工程师
IP属地:北京
暂未填写个人简介
私信
关注
1. 简历深挖2. mysql binlog了解吗3. shell脚本写过吗4. 两个集群,一张hive表如何进行数据共享,A集群如何同步到B集群中5. 一张订单表,支付状态会发生变化,如何采集到ods?面试官说由于每张mysql表都是在系统上有应用的,所以应该用update的方式更新支付状态,不能采用数仓的方式去思考问题,不能用拉链表。数仓可以保存历史数据,但是mysql表必须要用update的方式,不然在系统上数据会显示错误。用户角度:如果数据状态没有更新就会出现,用户界面就会显示未支付。6. sql执行流程7. 数据倾斜,9999w条id为1的数据,如何处理数据倾斜问题8. 数仓的分层9. hadoop是什么10. spark和mapreduce的应用场景。11. 三个sql题第一道:b left join a表的返回结果是什么a:id name1   a1   a2   b3   eb:id name1   a1   a2   b第二道:忘了,简单的累计开窗函数第三道:列转行tab:t_1 t_2 t_3a      c    1a      d    2a      e    3a      c    4a      d    5a      e    6结果表t_1    res_2   res_3   res_4a         1           2         3b         4           5         6select  t_1  ,max(case when t_2 = 'c' then t_3 end) as res_2  ,max(case when t_2 = 'd' then t_3 end) as res_3  ,max(case when t_2 = 'e' then t_3 end) as res_4from tab group by t_1#滴滴##滴滴实习##滴滴数据开发#
xunk333:第五题,用maxwell监视mysql的binlog来同步数据,如果mysql的操作是update,接收到的json里面会有old字段来记录更新之前的数据
投递滴滴等公司10个岗位
0 点赞 评论 收藏
分享
关注他的用户也关注了:
牛客网
牛客企业服务