懂车帝数据开发面经
1.自我介绍
2.你的项目是***吗?)(是的)
3.你项目中的职责是?
4.你项目的数据是网上开源带的模拟数据吗?
5.项目里都有哪些表?
6.你口述一下七天内连续下单的思路
7.介绍一下另一个项目
8.数据迁移过程中数据丢失了的原因有没有想过?
(我写了我迁移很多表)
9.其他高级语言能力呢? 答:用java比较多
(回头听录音才发现这个大问题,感觉寄了
因为一面的面试官跟我说过他们用python!)
10.聊聊自定义函数
11.聊聊spilt函数的应用(我举了个具体的需求来回答)
12.spilt函数拓展怎么保证顺序?
(我说spilt没有顺序,搞顺序可以collect_list套一个sort_array)
13.聊聊分区表和分桶表?
14.分桶表怎么设置???
(我就说是在insert into table.....后面
那堆设置里面写,具体写法我忘了)
15.聊聊order by与sort by
16.你能实习多久?
17.你说说你对数据仓库的理解
(我直接说我自己的理解,没背八股)
你有什么想问我的吗?
反问:
1.具体工作内容
2.你们数据口径这一块怎么管理(我其实是想了解一下
大厂的数据口径能不能统一起来,因为之前我面试被
问到怎么统一数据口径)
心得:
全程25min,好像是组长还是主管面的,但是我感觉主管不太期待我的表现,很多问题都问很浅,不深入问我。我回头复盘的时候总感觉自己表现很差,还得努力,继续沉淀!!!
技术总结:
1.hive一些基础操作一定要滚瓜烂熟,hive的自定义函数再深入深入
2.项目要吃透,尤其是sgg,sgg最经典也最具代表性,可以换位思考一下我是面试官“你连sgg都聊不明白,一步一步喂着做的项目都做不好,我凭什么用你。”
3.多面试的好处是可以提前在前面面试了解他们用什么架构对哪方面技术感兴趣,比如一面面试官已经告诉我用python,hive,那我完全可以准备一些这方面的知识,面试时不经意间引导面试官往这方面问,然后答出早就准备好的答案