数仓实习生面试
总体问的都是蛮基础的,也是根据简历来问的,你简历上写熟悉哪些,就会问哪些
1.自我介绍
2.项目来源,自己做的还是网上找来做的
3.离线数仓介绍
4.项目遇到的问题(提到kafka的重复数据)
5.为什么kafka会出现重复数据
6.你项目中怎么处理的
7.数仓分层的好处
8.数仓分了哪几个数据域
9.讲一些维度建模
10.常见的维度模型(雪花、星型)
11.使用场景
12.除了维度建模,还有哪些建模理论(E-R)
13.E-R模型讲一下(提到数据库范式)
14.讲一下三范式
15.事实表的分类
16.spark相比mr的优点(因为项目是hive on spark)
17.hadoop的读写原理
18.读写过程中,datenode挂掉了,怎么处理
19.你两个项目更倾向于做哪方面(一个实时,一个离线)
20.==和equals的区别
21.StringBuilder和StringBuffer区别
22.简历提到的做过python开发,是做了什么
23.平时是用python语言写脚本还是shell语言
24.hive的优化方式
25.自定义udf的过程
26.窗口函数使用过哪些,介绍一下
27.row_numer和rank以及dense_rank的区别
28.学习途径
29.校园经历
30.对工作上出现的一些场景的看法
31.反问
教训:
1.不能够很好的表达意思,表达较为混乱,其实都是一些基础的八股。解决:可以多用自己的话去回答这些八股题,不然面试一紧张,就语无伦次,多用自己的话去总结回答问题
2.简历中提到的东西,尽量去弄懂搞清楚,并把相关的八股好好准备一下
3.可以拓展面试官的问题的回答,提到一些自己知道的东西,然后引导面试官往那方面提问。
#数仓面试# #有车以后#广州的一个中小公司吧
1.自我介绍
2.项目来源,自己做的还是网上找来做的
3.离线数仓介绍
4.项目遇到的问题(提到kafka的重复数据)
5.为什么kafka会出现重复数据
6.你项目中怎么处理的
7.数仓分层的好处
8.数仓分了哪几个数据域
9.讲一些维度建模
10.常见的维度模型(雪花、星型)
11.使用场景
12.除了维度建模,还有哪些建模理论(E-R)
13.E-R模型讲一下(提到数据库范式)
14.讲一下三范式
15.事实表的分类
16.spark相比mr的优点(因为项目是hive on spark)
17.hadoop的读写原理
18.读写过程中,datenode挂掉了,怎么处理
19.你两个项目更倾向于做哪方面(一个实时,一个离线)
20.==和equals的区别
21.StringBuilder和StringBuffer区别
22.简历提到的做过python开发,是做了什么
23.平时是用python语言写脚本还是shell语言
24.hive的优化方式
25.自定义udf的过程
26.窗口函数使用过哪些,介绍一下
27.row_numer和rank以及dense_rank的区别
28.学习途径
29.校园经历
30.对工作上出现的一些场景的看法
31.反问
教训:
1.不能够很好的表达意思,表达较为混乱,其实都是一些基础的八股。解决:可以多用自己的话去回答这些八股题,不然面试一紧张,就语无伦次,多用自己的话去总结回答问题
2.简历中提到的东西,尽量去弄懂搞清楚,并把相关的八股好好准备一下
3.可以拓展面试官的问题的回答,提到一些自己知道的东西,然后引导面试官往那方面提问。
#数仓面试# #有车以后#广州的一个中小公司吧
全部评论
为什么这么多八股 项目聊得多吗
哈喽,过了没呀。
重复数据可以讲讲吗佬
相关推荐
12-12 17:02
中国第一拖拖拉机集团有限公司拖拉机学院 大数据开发工程师 点赞 评论 收藏
分享
查看15道真题和解析
点赞 评论 收藏
分享