快手 数据开发 一面 70min
感觉自己和快手的相性不是很好,每次都和面试官不和,感觉应该是无缘快手
1.自我介绍,大数据组件是自学的吗
2.工作内容,定位,成果介绍
3.前期调研也是你做的吗,怎么调研出的指标体系,耗时多久
4.复购率是几日复购率,为什么选择这个天数不选择15天,你这个调研不够深刻,调研他的打法和业务目标不才是第一步要做的事吗
5.有多少个维度和指标,为什么用grouping sets不用cube,介绍count distinct又被打断,无语
6.数据怎么保障质量,你不要说详细的方法,我要听整个的方法论
7.基线机制怎么保证的,数据延迟了怎么办,又说我说的是在搞笑,难绷
8.介绍hive和spark,为什么不用spark sql而用hive sql
9.spark的rdd包含哪些元素
10.spark基于内存你是怎么理解的,如果我mapreduce把环形缓冲区开到很大,不也是基于内存了吗,你认为这两个的区别
11.惰性加载的好处
12.数仓方法论介绍
13.数据跨域的问题(这个之前也被快手问过)
14.数据倾斜介绍,说一半又被打断说这个数据倾斜在spark2.6已经被解决了,说我了解太少
15.sql题:①多个个用户对在发消息,如果a发给b,b回复a则算一次完整对话,判断每个用户对共有多少个完整对话,并将完整对话连接到一起
②直播间的最大在线人数和时长
快手面试题感觉多面几次就都是重复的了。
ps:面试官太喜欢反驳了,而且频繁打断我讲话,我还在说我们一开始选择的做法是巴拉巴拉,他就说你们这种做法完全不行啊,😅😅😅
大概率和快手说再见了,悲伤 #数据人的面试交流地#
1.自我介绍,大数据组件是自学的吗
2.工作内容,定位,成果介绍
3.前期调研也是你做的吗,怎么调研出的指标体系,耗时多久
4.复购率是几日复购率,为什么选择这个天数不选择15天,你这个调研不够深刻,调研他的打法和业务目标不才是第一步要做的事吗
5.有多少个维度和指标,为什么用grouping sets不用cube,介绍count distinct又被打断,无语
6.数据怎么保障质量,你不要说详细的方法,我要听整个的方法论
7.基线机制怎么保证的,数据延迟了怎么办,又说我说的是在搞笑,难绷
8.介绍hive和spark,为什么不用spark sql而用hive sql
9.spark的rdd包含哪些元素
10.spark基于内存你是怎么理解的,如果我mapreduce把环形缓冲区开到很大,不也是基于内存了吗,你认为这两个的区别
11.惰性加载的好处
12.数仓方法论介绍
13.数据跨域的问题(这个之前也被快手问过)
14.数据倾斜介绍,说一半又被打断说这个数据倾斜在spark2.6已经被解决了,说我了解太少
15.sql题:①多个个用户对在发消息,如果a发给b,b回复a则算一次完整对话,判断每个用户对共有多少个完整对话,并将完整对话连接到一起
②直播间的最大在线人数和时长
快手面试题感觉多面几次就都是重复的了。
ps:面试官太喜欢反驳了,而且频繁打断我讲话,我还在说我们一开始选择的做法是巴拉巴拉,他就说你们这种做法完全不行啊,😅😅😅
大概率和快手说再见了,悲伤 #数据人的面试交流地#
全部评论
他们部门搞的是快手招聘,说是主要招蓝领,听都没听过😃
感觉和部门关系很大,我面的面试官态度挺好
相关推荐
11-04 10:40
温州大学 Java 点赞 评论 收藏
分享
点赞 评论 收藏
分享