携程数据仓库日常实习面筋

面试前一天上午和我说晚上面试官在高铁上,改时间到第二天下午

  1. 数据仓库的介绍,项目的数仓怎么设计的
  2. 数仓分层问题,每一层的数据流向。会从ods层取数据吗,什么时候会向dws层取数据,什么时候会从dwd层取数据。新业务来了数仓怎么扩展
  3. 业务总线矩阵横纵坐标代表什么,维度冗余情况介绍
  4. ER模型和维度模型优缺点
  5. 什么是业务过程,什么是粒度。(我简单说了一下,也举了个例子说明。但是让我用抽象的定义语言来阐述)
  6. Hive的存储格式。orc列式存储的压缩方法,为什么orc读取数据快。有没有看过orc的相关文档
  7. Hive的一些优化经验和方法
  8. Spark3.X的新特性有哪些。Spark的常见的action算子和transformer算子
  9. Hive on spark出现数据倾斜怎么判断,如何定位。我说可以从UI界面看任务执行情况,然后继续问UI界面哪些东西和数据倾斜相关
  10. 怎么调优Spark的相关参数,处理数据倾斜
  11. 一道sql手撕,牛客网原题,中等难度。但是脑袋一热没写出来,其实非常简单。

反问环节,我问了一下组内业务架构。回答我不清楚,因为他不是这个组的,原来面试我的人临时有事情,他帮别人来面试。

全部评论
佬是科大的吗?
点赞 回复 分享
发布于 12-16 15:42 安徽
欢迎
点赞 回复 分享
发布于 12-16 18:08 上海
佬,你还记得是哪道题吗
点赞 回复 分享
发布于 昨天 17:09 黑龙江

相关推荐

评论
1
4
分享
牛客网
牛客企业服务