携程数仓实习(一二面凉经)
3.20 一面
没有自我介绍
先介绍自己的项目,然后对项目提问(问得很少)
给一个你不熟悉的业务,要求做一些报表、指标,你会怎么做(如何设计数据仓库,数仓建模)
Hive有哪些存储文件格式,对应的应用场景(这块没答好)
给一个txt文件,load数据到Hive中需要考虑哪些问题(这里回答的也烂)
给A、B两张表进行join,描述join的过程
用MapReduce详细的描述join的过程
给定一张订单表请考虑它的一个表结构(分区表?不分区),存储数据使用增量表?全量表?为什么?
基于订单表继续丰富场景,问订单表常发生状态的变化,该怎么存储维度变化?
答:拉链表
详细描述一下该如何实现拉链表,面试官人很好,说得不对的会帮我补充,还会帮我梳理思路
sql题:给定一个打卡表(dep_id,uid,time),求连续打卡次数(用户两次打卡中间没有其他人,则认为是连续打卡)
3.25 二面
面试官迟到了几分钟
自我介绍
介绍项目(以数仓的形式介绍的)
项目中存在的难点
针对说的难点继续挖(说得不是很清晰,面试官说没听懂我说的)
对AI、LLM的了解
对脚本语言的了解,比如shell、python
为什么选择数仓开发,结合LLM说一下自己的看法
在业务实现过程中,可能会遇到好沟通的或者不好沟通的人,你有没有遇到过这种情况,如何处理
反问:
部门具体的业务
面试表现(对我说的项目难点不满意,感觉就是那个问题没答好,后面回答的也很烂)