科拉奥数据开发一面
说一下数仓项目的架构(离线和实时都问了)
说一下数仓分层及其作用
DWD层和DWS层的区别
事实表有哪些,为什么要设置周期快照事实表
说一下ADS层完成的比较难的需求及其实现(离线数仓的)
说一下为什么在实时项目中加入Redis作为缓存
说一下为什么使用LookUpJoin
MapReduce的工作原理
Hive怎么调优
Flink水位线机制
一道HiveSQL:假设有一张用户登录表,如何求出连续三天登录的用户
反问:
入职主要干啥
简历中哪点吸引了你
回答的怎么样
个人感觉答的不是很好的:
说一下ADS层完成的比较难的需求(这里我倒是说了一个,但是感觉面试官好像听得不是很懂的样子QWQ)
Hive怎么调优(这个主要说了分组和Join如何调优,其他参数实在不会)
Flink水位线机制,这个答完面试官说水位线主要处理乱序数据,但是我答的方向是可以使用事件时间,提高准确性
一开始宿舍比较吵,然后上天台开流量面试的,后来面完面试官说声音不是很连续,以后长记性了得找个网好点的地方
感觉要寄