知乎大数据开发校招一、二面面经

预先不知道一、二面同时进行,面了两个小时身心俱疲
面经是一面和二面的问题汇总,但是问题出现顺序可能会有些变化
一面
自我介绍
项目经验
在介绍完项目过后,面试官觉得我的反思比较多,让我提炼一下关键信息
为什么采用双分区加高优任务解决执行效率问题,不会出现依赖混乱的问题吗
详细讲讲你OLAP选型的思路,并且能否详细对比一下你提到的几款olap引擎(CK,doris,kylin)
数据仓库分为哪几层,每层分别是做什么的
数据主题域是怎样进行划分的,项目中是否也是同样进行划分
mapreduce的shuffle
hiveSQL和SparkSQL的区别
flink的背压机制
spark的宽窄依赖
SQL题
连续登录
接下来是反问
我问了一些对于湖仓一体,流批一体的看法,以及是否有打算进行探索
二面
自我介绍
目前采用的实时架构是怎样的?(flink还是flink+doris)
doris的join是什么类型的?
为什么采用flink+doris他的优缺点有哪些?有没有其他方案,优缺点?
数据倾斜问题,计算pv、性别个数应该采用那种方案解决数据倾斜,为什么?
数仓的分层,每层是做什么的,分层的好处
你觉得怎样判断一个数据明细模型是否算做一个好的数据明细模型
讨论了一下开发过程中遇到的技术债,指标同名不同义等,以及解决方案
简历里面的一个高执行时长高资源占用任务优化是怎样进行的?
为什么会出现这种性能瓶颈
分主题预计算的好处和坏处是什么?
指标维度矩阵了解吗?
推荐我继续深入研读数据仓库工具箱
反问
同样是问了流批一体和湖仓一题的看法

感觉自己的数仓基础还是需要进行提高
并且由于没太背八股文,导致一些底层原理的问题回答得不是那么完善,之后还是需要多加复习


#面试题目##知乎#
全部评论
问算法了吗?需要手撕吗
1 回复 分享
发布于 2022-03-17 14:04
请问你做的是实验室的项目吗
点赞 回复 分享
发布于 2022-03-22 22:07
怎么不多问点实时
点赞 回复 分享
发布于 2022-04-01 04:32
能问下 hiveSQL和SparkSQL的区别  这个楼主咋答的啊
点赞 回复 分享
发布于 2022-04-19 20:28

相关推荐

评论
3
45
分享

创作者周榜

更多
正在热议
更多
# 听劝,这个简历怎么改 #
14086次浏览 182人参与
# 面试被问“你的缺点是什么?”怎么答 #
6359次浏览 98人参与
# 水滴春招 #
16356次浏览 346人参与
# 入职第四天,心情怎么样 #
11310次浏览 63人参与
# 租房找室友 #
8021次浏览 53人参与
# 读研or工作,哪个性价比更高? #
26152次浏览 356人参与
# 职场新人生存指南 #
199211次浏览 5509人参与
# 参加完秋招的机械人,还参加春招吗? #
26977次浏览 276人参与
# 文科生还参加今年的春招吗 #
4108次浏览 31人参与
# 简历无回复,你会继续海投还是优化再投? #
48624次浏览 561人参与
# 你见过最离谱的招聘要求是什么? #
144719次浏览 829人参与
# 如果重来一次你还会读研吗 #
155716次浏览 1706人参与
# 机械人选offer,最看重什么? #
69077次浏览 449人参与
# 选择和努力,哪个更重要? #
44292次浏览 493人参与
# 如果再来一次,你还会学硬件吗 #
103645次浏览 1245人参与
# 如果你有一天可以担任公司的CEO,你会做哪三件事? #
20520次浏览 413人参与
# 招聘要求与实际实习内容不符怎么办 #
46727次浏览 494人参与
# 22届毕业,是读研还是拿外包offer先苟着 #
4652次浏览 27人参与
# 你们的毕业论文什么进度了 #
901211次浏览 8960人参与
# 软开人,你觉得应届生多少薪资才算合理? #
81375次浏览 496人参与
# 国企还是互联网,你怎么选? #
109189次浏览 853人参与
牛客网
牛客企业服务