快手数据研发凉经

1h10 min
面试官是个大佬,全程面试偏场景题
八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件
场景题:
快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播
有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决
雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用过
上层埋点时如果出现时间不一致怎么解决(什么玩意,不会)
离线数仓的实时性了解吗?(没太听懂面试官的点)但还是答了自己理解
为什么实时数仓现在还是在企业里无法完全替代离线数仓?
FLINK的缺点知道吗(不太了解)
手撕3个sql:比较简单,经典连续登录,留存率,left join 问题,全搞出来了
反问:面试表现:基础尚可,但缺少实际的企业项目经验。(寄了)
面试官主要做的工作:管整个大数据组的,什么项目都做一点
鉴定为寄
全部评论
我感觉面试官有病,要是有企业项目经验,那还是应届生吗
4 回复 分享
发布于 2023-09-22 23:37 北京
啥部门呀
点赞 回复 分享
发布于 2023-09-20 22:00 北京
官网流程咋样。我这一直面试中
点赞 回复 分享
发布于 2023-09-26 18:16 上海
为啥现在问的八股越来越难了😭
点赞 回复 分享
发布于 2023-10-04 21:27 陕西
请问第一个场景题,开播流量大数据倾斜应该怎么解决呀~
点赞 回复 分享
发布于 2023-10-05 03:09 广东
几面呀
点赞 回复 分享
发布于 2023-10-05 22:09 北京
这跟我二面一模一样,怀疑是同一位面试官
点赞 回复 分享
发布于 11-01 10:03 湖北

相关推荐

不愿透露姓名的神秘牛友
11-15 00:38
字节跳动 数据开发 48w 其他
点赞 评论 收藏
分享
评论
点赞
37
分享
牛客网
牛客企业服务