百度大数据开发二面面经
2022-07-27 下午 时长1h5min
百度的面试官真的很好,这点没得说
1 自我介绍
2 数据倾斜——结合业务说了分组聚合和join,大表大表join怎么解决数据倾斜,展开说
3 SQL 没做出来,但是面试官全程提示,沟通交流
4 Hive和Spark哪个比较熟悉,我们聊一聊——都比较熟悉,问了Hive组件和底层执行逻辑,逻辑计划优化有哪些方法,什么是谓词下推(自己提到了)
5 算法:数组 找所有元素之和为0的三个不重复的数字,
6 HashMap安全吗?不安全,为什么,延伸聊一聊,说了保证安全的synchronizedXXX以及ConcurrentHashMap,ConcurrentHashMap获取全局属性的时候存在问题(自己提出),有什么优化方法
7 可以实习吗?
8 有拿到其他公司的offer吗?
9 聊一聊你的学习方式方法、看博客看视频以及看源码之间的区别感受
反问
面试官全程都有沟通交流,能学到很多东西。