字节数开面经一/二/三
被ks恶心完已经有点想摆了
偷了大家很多面经,回馈一下,也欢迎数开的xdm交流
一面:
实习拷打15min
如果有一个指标你会怎么去加工,逻辑会怎么去写
一个hql提交的具体执行过程
mr的整体过程
spark跑任务有几个阶段
Hadoop生态都有什么;HDFS组成部分,存储逻辑
数据倾斜,有没有实际优化过
对数仓的理解(基本建模/分层所有的八股都问了一遍)
hive和mysql之间的差异,mysql怎么实现毫米级的响应,b+树为什么快
想汰换表会怎么做
sql1 把string结构的数据转换成sql可用的数据结构,然后算中位数
sql2同时在线
二面:
实习拷打20min
对数仓建模的认识,实操过程你是怎么做的
flink-cdc是什么,有没有遇到过什么问题
phoenix,hbase是做什么的
hql提交后做了什么事情最后把数据生成出来
逻辑执行计划和物理执行计划有什么区别,为什么要分这两个
左表五条数据left join右表三条数据,结果是几条
map join知道吗?
sql:一张表记录学生和得分情况,展示分数高于平均分的学生id和分数
三面:
实习拷打20min(跟一二面不同的是他更在乎实操的细节)
spark调优场景20min(都是基于实习的场景给我提问题)
MR重启任务从哪开始跑,如果长时间任务(T+2)怎么减少重启对时效性的影响
算法:滑动窗口
总结下来感觉一二面比较重基础,三面比较注重实操和宏观思维吧,但应该也因面试官而异
实习和项目留点不详细的部分能分担不少八股火力
偷了大家很多面经,回馈一下,也欢迎数开的xdm交流
一面:
实习拷打15min
如果有一个指标你会怎么去加工,逻辑会怎么去写
一个hql提交的具体执行过程
mr的整体过程
spark跑任务有几个阶段
Hadoop生态都有什么;HDFS组成部分,存储逻辑
数据倾斜,有没有实际优化过
对数仓的理解(基本建模/分层所有的八股都问了一遍)
hive和mysql之间的差异,mysql怎么实现毫米级的响应,b+树为什么快
想汰换表会怎么做
sql1 把string结构的数据转换成sql可用的数据结构,然后算中位数
sql2同时在线
二面:
实习拷打20min
对数仓建模的认识,实操过程你是怎么做的
flink-cdc是什么,有没有遇到过什么问题
phoenix,hbase是做什么的
hql提交后做了什么事情最后把数据生成出来
逻辑执行计划和物理执行计划有什么区别,为什么要分这两个
左表五条数据left join右表三条数据,结果是几条
map join知道吗?
sql:一张表记录学生和得分情况,展示分数高于平均分的学生id和分数
三面:
实习拷打20min(跟一二面不同的是他更在乎实操的细节)
spark调优场景20min(都是基于实习的场景给我提问题)
MR重启任务从哪开始跑,如果长时间任务(T+2)怎么减少重启对时效性的影响
算法:滑动窗口
总结下来感觉一二面比较重基础,三面比较注重实操和宏观思维吧,但应该也因面试官而异
实习和项目留点不详细的部分能分担不少八股火力
全部评论
佬 方便分享点HR面的内容吗?
老哥三面都直接考场景实操了吗,实习过程中都接触过嘛?咱都没经历过这些经验诶
老哥 一面这个指标加工怎么理解
相关推荐
查看9道真题和解析
点赞 评论 收藏
分享