腾讯数开面筋-全程无八股
1. 自我介绍
上来先问我,你实习就是去写文档吗,压力拉满
2. 深挖项目,确定是不是真自己做
3. 处理过线上bug,是怎么处理的,对于重复数据,having count 确定重复数据,用开创函数row_number完成去重
4. 项目中新增维度问题
5. Spark ui中有哪些东西,定位数据倾斜,如何优化
6. 手撕1到100w中1的个数,除了正常的思维逻辑还有什么其他的算法
7. 提高查看Spark,flink源码
------------------------------------------------------------------------------------------------------------------------
二面30min,kpi了
1、自我介绍
2、spark和doris区别,海量数据为什么用spark
3、spark原理,框架
4、spark shuffle
5、处理数据倾斜
6、两段实习都涉及数仓吗,讲一下
7、海量数据上传到hdfs会遇到什么问题
上来先问我,你实习就是去写文档吗,压力拉满
2. 深挖项目,确定是不是真自己做
3. 处理过线上bug,是怎么处理的,对于重复数据,having count 确定重复数据,用开创函数row_number完成去重
4. 项目中新增维度问题
5. Spark ui中有哪些东西,定位数据倾斜,如何优化
6. 手撕1到100w中1的个数,除了正常的思维逻辑还有什么其他的算法
7. 提高查看Spark,flink源码
------------------------------------------------------------------------------------------------------------------------
二面30min,kpi了
1、自我介绍
2、spark和doris区别,海量数据为什么用spark
3、spark原理,框架
4、spark shuffle
5、处理数据倾斜
6、两段实习都涉及数仓吗,讲一下
7、海量数据上传到hdfs会遇到什么问题
全部评论
想问一下是投的数据工程吗,哪个部门捞的啊
我数据工程全是问八股55
请问1到100w中1的个位,是什么思路呀
相关推荐