呀呀呀呀求offer

2023-10-22 15:47 门头沟学院 Java

关注

数仓实习生面试

总体问的都是蛮基础的，也是根据简历来问的，你简历上写熟悉哪些，就会问哪些
1.自我介绍
2.项目来源，自己做的还是网上找来做的
3.离线数仓介绍
4.项目遇到的问题（提到kafka的重复数据）
5.为什么kafka会出现重复数据
6.你项目中怎么处理的
7.数仓分层的好处
8.数仓分了哪几个数据域
9.讲一些维度建模
10.常见的维度模型（雪花、星型）
11.使用场景
12.除了维度建模，还有哪些建模理论(E-R）
13.E-R模型讲一下（提到数据库范式）
14.讲一下三范式
15.事实表的分类
16.spark相比mr的优点（因为项目是hive on spark）
17.hadoop的读写原理
18.读写过程中，datenode挂掉了，怎么处理
19.你两个项目更倾向于做哪方面（一个实时，一个离线）
20.==和equals的区别
21.StringBuilder和StringBuffer区别
22.简历提到的做过python开发，是做了什么
23.平时是用python语言写脚本还是shell语言
24.hive的优化方式
25.自定义udf的过程
26.窗口函数使用过哪些，介绍一下
27.row_numer和rank以及dense_rank的区别
28.学习途径
29.校园经历
30.对工作上出现的一些场景的看法
31.反问

教训：
1.不能够很好的表达意思，表达较为混乱，其实都是一些基础的八股。解决：可以多用自己的话去回答这些八股题，不然面试一紧张，就语无伦次，多用自己的话去总结回答问题
2.简历中提到的东西，尽量去弄懂搞清楚，并把相关的八股好好准备一下
3.可以拓展面试官的问题的回答，提到一些自己知道的东西，然后引导面试官往那方面提问。

#数仓面试# #有车以后#广州的一个中小公司吧

全部评论

推荐最新楼层

长沙市雨花区砂子塘小学安卓

为什么这么多八股

项目聊得多吗

1 回复分享

发布于 2023-10-28 22:07 广东

门头沟学院数据仓库

哈喽，过了没呀。

点赞回复分享

发布于 2023-10-26 20:40 广东

小米集团_自动驾驶_软件研发工程师

重复数据可以讲讲吗佬

点赞回复分享

发布于 2023-11-12 13:01 湖北

12-12 17:02

中国第一拖拖拉机集团有限公司拖拉机学院大数据开发工程师

数仓建模八股是真难背，比spark还难背，背自闭了

面试题刺客退退退如何判断面试是否凉了

点赞评论收藏

分享

12-02 13:49

SHEIN希音_大数据开发(实习员工)

双非鼠鼠终于好起来了，7月开始秋招泡到现在最好的offer，发帖牛客还愿深圳虾皮数开tl:笔试9.24一面10.16二面10.25hr面11.1oc12.2一面拷打实习。flink的checkpoint怎么做的，公司里怎么解决checkpoint大状态问题flink的回撤流机制是怎么做的介绍一下湖仓一体架构，为什么要出现数据湖的解决方案sr的物化视图，为什么sr做到实时，介绍存算分离与存算一体二面拷打实习。介绍数仓建模理论，并举例说明在公司里的离仓是怎么落地的介绍实习做的表如何体现维度模型手撕：sql取a表有b表没有的数据，还有一道滑动窗口算法希望大家都能上岸

查看7道真题和解析

点赞评论收藏

分享

12-19 12:46

门头沟学院后端

携程数仓日常实习

12.17 中午投递12.17 晚上面试12.18 OC上来面试官说节省时间就不进行自我介绍了直接做了四道题，做完四道题问了业务总线矩阵是什么第一道：求员工绩效最高的三个月（可以并列）。就是聚合加开窗 rank 函数的运用第二道：求最近一日留存率，两种解法第三题：忘了是啥了但是难度也不大第四道：下面的代码输出是什么几行几列都是什么，and 换成 where 输出是什么 select * from( select 1 as id union all select 2 as id union all select 3 as id ) t1...

查看3道真题和解析

点赞评论收藏

分享

12-01 14:35

携程_数据仓库(实习员工)

中科院信工所数开一面凉经

本人是26届数开选手 找的日常实习 中科院信工所的数据开发主要业务是做安全相关的 底层是大数据技术。11/26 一面，问题如下1. 自我介绍2. 实习时长，实验室研究方向，如果进来的话会考虑转正吗3. 了解过liunx吗？如果我们要查看各个运行的进程具体情况用哪些指令，查看显卡运行情况用什么指令4. 熟悉哪些语言？java常见集合有哪些5. 如果我们往hashmap中插入一个元素，说说这个过程底层是怎么实现的6. 项目数据来源，说说用什么方式采集的7. 简单说说kafka架构是怎么样的，那它里面数据是有序的吗？怎么解决kafka中数据重复问题8. HDFS小文件过多有什么影响，应该怎么解决？9. 了解过spark吗？spark相关算子有哪些？groupbykey和reducebykey有什么区别 具体说说10. 了解过flink吗反问环节总结：无手撕，面试官反应 基础知识不是很牢固 项目使用的组件不太清楚 被认为数仓搭建没有自己从0-1动手做（实际自己跟着视频一步步敲了 不过确实答的不好）因为项目是离线数仓 所以被问到spark和flink直摇头，面试的老师还是挺好的，继续学习吧#日常实习面试##数据开发##寒假实习#

查看10道真题和解析

点赞评论收藏

分享

12-17 16:27

已编辑

第一拖拉机制造厂拖拉机学院大数据开发工程师

携程数据仓库日常实习面筋

面试前一天上午和我说晚上面试官在高铁上，改时间到第二天下午数据仓库的介绍，项目的数仓怎么设计的数仓分层问题，每一层的数据流向。会从ods层取数据吗，什么时候会向dws层取数据，什么时候会从dwd层取数据。新业务来了数仓怎么扩展业务总线矩阵横纵坐标代表什么，维度冗余情况介绍ER模型和维度模型优缺点什么是业务过程，什么是粒度。（我简单说了一下，也举了个例子说明。但是让我用抽象的定义语言来阐述）Hive的存储格式。orc列式存储的压缩方法，为什么orc读取数据快。有没有看过orc的相关文档Hive的一些优化经验和方法Spark3.X的新特性有哪些。Spark的常见的action算子和transfor...

查看15道真题和解析

点赞评论收藏

分享

评论

11

41

招聘动态

万兴科技

30W＋年薪热招校园精英

快手

2025届校园招聘

26届实习社群招新啦！

全站热榜

正在热议

# 秋招感动瞬间 #

3548次浏览 55人参与

# 你都收到了哪些公司的感谢信？ #

3794122次浏览 32712人参与

# 被同事甩锅了怎么办 #

10737次浏览 75人参与

# 职场吐槽大会 #

99991次浏览 811人参与

# 上班到公司第一件事做什么？ #

20429次浏览 216人参与

# 哪个瞬间让你对大厂祛魅了？ #

162932次浏览 1009人参与

# 打杂的实习你会去吗？ #

91293次浏览 819人参与

# 工作压力大怎么缓解 #

41451次浏览 713人参与

# 如何一边实习一边秋招 #

1057806次浏览 13163人参与

# 软件开发2024笔面经 #

2381651次浏览 48655人参与

# 你想留在一线还是回老家？ #

9058次浏览 171人参与

# 通信硬件知识分享 #

2568次浏览 43人参与

# 想实习转正，又想准备秋招，我该怎么办 #

519215次浏览 5217人参与

# 小米求职进展汇总 #

611305次浏览 4722人参与

# 华为工作体验 #

129843次浏览 975人参与

# 实习与准备秋招该如何平衡 #

763212次浏览 8793人参与

# 字节跳动工作体验 #

247780次浏览 3249人参与

# 毕业后不工作的日子里我在做什么 #

126979次浏览 1152人参与

# 选择和努力，哪个更重要？ #

27268次浏览 292人参与

# 测测你的职业性格 #

16856次浏览 213人参与

牛客网
牛客企业服务