2022携程提前批大数据一/二面经(OC)
2022携程提前批大数据一/二面经(OC)
开篇先说明:本次面试的岗位是大数据底层框架工程师,不是大数据分析,数据仓库,数据开发。
个人:双非本硕
一面
时常
45分钟
问题
因为我有一段大厂实习,所以主要针对我实习问了很久,一切问题都结合实习进行提问,所以要是没接触过没关系,咱们实习的内容不一样。而且因为当时暑期实习也是这个面试官面试的,所以基础的问题也没有怎么问。
-
实习做了什么,有什么收获
-
对于presto的理解,和hive/spark有什么不同
-
对sparksql调优有没有遇到,实际情况是什么
-
对框架apache atlas的理解
然后大概就是我表示很有缘,为啥后面没去(二面,一面时间隔得太久了当时),聊一下他们组正在干的事情,让我回去有空可以了解一下spark3还有一些别的(这段时间大概20分钟,心里已经很稳了)
感受
很棒,没有迟到
二面
时长
1h45min,是的,你没看错,就是这么久,哎。
问题
时间过去有些久了,要是遗忘了请见谅。问题顺序也是乱的,不要在意这些细节。
-
自己平时用哪些编程语言
-
ArrayList和LinkedList什么时候该用哪个:自己稍微解释一下就行,有自己的理解就好,不需要背课文
-
ArrayList有上限么,如果有,能给出解决方方案么:我给了分布式存储和spark中压缩存储的方法这两个策略
-
jvm gc 常见的方法:那几个概念稍微说一下就行,面试官知道你实际中没用过
-
如何判断发生了数据倾斜,有哪些情况会引起倾斜
-
如何找出在哪个部分发生了数据倾斜
-
如何在map/reduce端发生倾斜后,快速定位到出问题的表或者文件
-
spark3新特性有哪些
-
spark3新特性在实际工作中有关注过么
-
presto和hive/spark区别,并且实际编写中有遇到什么困难:再次问到
-
apache atlas:我介绍了如何监控元数据并且传递变化信息
-
数据治理一些常见的框架的交流和分析:有一些框架知道你没看过,只是想问你觉得会如何设计,比如如果实现一个对sql单元测试的模块,怎么设计
-
mr job 有没有写过,基本流程是什么
-
一道智力题:和位运算有关
感受
很棒,没有迟到。而且问的其实大部分都不是之后工作可能接触最多的内容,问的很多还是偏向我实习的这部分,更多的想了解你的潜力,而不是你和我的岗位是不是完全匹配,所以会发现问的问题包含很多数仓的(实习做的数仓),这是我心中面试官的样子,不是拿个套路问问问的类型,看中的是人,而不是人会的技能,技能可以学,人变不了。
#携程面试##携程##校招##面经#