Shopee 大数据开发 二面

9.29 二面的,面经一直忘记发了😂

- 介绍一下实习部门的业务,以及你的工作内容和业务的关联
- 介绍一下部门的数仓架构、人员分工
- 一个看板的需求讲一下,建模的流程是怎样,后续有关注运营是怎么用这份数据的吗
- 一个去重性能优化的需求讲一下,具体一步步怎么做详细拆解,这里问得很细,面试官对技术的了解程度很深
- 任务的分桶优化讲一下,具体是怎么做的,原理是什么,需要开启哪些参数,使用时需要注意什么
- 小文件治理
- 你对大数据开发工作的理解,你对哪些方面感兴趣
- 一面有做题吗(做了 3 道都通过了),那行就不用做了
- 为什么回国
- 反问:业务、组织架构、技术栈等

秋招碰到的最有技术热情的 leader 面,能看出面试官既有技术深度也有技术热情,是唯一一个跟我深入探讨简历项目技术细节的面试官,虾皮好感 +1
全部评论
佬base?
点赞 回复 分享
发布于 10-15 22:52 广东
佬约HR面了吗
点赞 回复 分享
发布于 10-16 15:31 江苏

相关推荐

-- 我的论文相关、spark1、网格怎么划分的2、基于spark做的吗,使用了哪些算子?这个转换类的:map、flatmap、mapPartitions、filter、reduceByKeyaction: reduce、collect、count(eg分发到各个节点网格数目统计)3、spark有哪些组件?组件之间怎么进行数据联通的?回答了,master、DAG生成、依赖关系、worker等等。答得不是很好4、yarn资源管理的工作机制(简历自己写的给忘了)5、yarn那些resouce manager、node manager 、application master、container角色?他们之间什么关系?每一个组件起的什么作用?6、spark有哪些shuffle?什么场景下用哪些shuffle?回答的hash shuffle和sort based shuffle。主要是中间文件太多。好像偏题了7、spark中出现数据倾斜,怎么解决?背的这个 https://blog.csdn.net/Aaron_ch/article/details/122224043两阶段聚合没说清楚。-- sql1、班级表、学生表;统计每个班级的平均分不需要考虑班级表left join学生表,只考虑学生表即可,班级表是一个迷惑条件。我中间意识到好像不用班级表,但是有一个班级名称重复的情况,面试官赞同了。面试官很好,还跟我讲了一下班级表是没用的。-- java基础1、线程安全保证的方式。答的四种关键字修饰 synchronized、volatile、atomic、final2、讲一下synchronized和volatile区别。没答上3、共享屏幕写一下synchronized单例模式。4、final、finally、finalize区别。只说了final修饰的变量必须初始化,后面不能被赋值;其他没打上来┭┮﹏┭┮,java基础忘背了。。。5、java线程池是什么,有哪些优势?没答上6、java8的lambda表达式是什么,说明一下优点、应用场景只回答了lambda匿名函数,方便...
点赞 评论 收藏
分享
2 5 评论
分享
牛客网
牛客企业服务