某金融科技数仓实习一面 (记录贴
几乎没有涉及八股,纯考数仓理论
1.雪花模型和维度建模的区别 三范式
2.有几种事实表(3种
3.sql(说思路
学生成绩表,学生,科目,成绩
A.取出每科第一名 rank()
B.转成学生,语文,数学,英语四列 sum(case when...
考勤表 id,date
A.连续登陆5日以上 date - row_number之后count
B.7日留存率 不细说了
留存率写的sql如何优化? 没说出来,但感觉面试官也是随口一问,说了一下刚刚回答中做的优化
4.项目数据链路
5.sqoop有几种导入模式
(不太确定,之前完全没了解过,甚至问了一下sqoop用的版本号,惊
6.数据量特别大该如何导入 引出数据同步策略, 全量or新增及变化
7.缓慢变化维,拉链表相关
8.dwd和dws层的区别
9.怎么区分维度表和事实表
10.场景题 银行卡账户如何设计表
回答的是累积型快照事实表
11.职业规划,怎么学习的相关知识,为啥想转数仓balabala
感恩面试机会,希望多来点