小药药_数开实习_一面
- 腾讯会议,开摄像头
- 手撕的sql是面试官当场搜出来问的,有点坑,没撕出来
## 项目
- 简单介绍一下你的项目
- 你这个数据做好以后,他就是需求方是怎么用到的?
- 这个数据你存在这个你这是存在hive里吗?
- 介绍整个项目的流程
- 介绍项目的数据域和业务的总线矩阵
- 我有做过数据治理吗
- 有过hive性能优化的经验吗
- 你们是用的是什么建模?
- 维度建模中那个缓慢维度变化为都有哪几种应对方式?
- 我的拉链表是怎么查看历史数据的
## 八股
- yarn的基础架构和基本角色
- 分享了一个spark任务提交的过程
- 分别讲讲yarn的资源调度策略
- 我们用的什么资源调度器
- 用的开源Yarn还是CDH yarn
## 手撕
```sql
有 msg_time,from,to, msg等字段,计算聊天两轮(用户消息一来一回表示一轮)以上的用户。
msg_time from to
2021-11-24 21:23:00 1 2
2021-11-24 21:23:01 2 1
2021-11-24 21:23:02 1 2
2021-11-24 21:23:03 2 1
2021-11-24 21:23:04 2 1
2021-11-24 21:23:01 3 1
2021-11-24 21:23:02 1 3
2021-11-24 21:23:03 3 1
2021-11-24 21:23:04 1 3
```
- 手撕的sql是面试官当场搜出来问的,有点坑,没撕出来
## 项目
- 简单介绍一下你的项目
- 你这个数据做好以后,他就是需求方是怎么用到的?
- 这个数据你存在这个你这是存在hive里吗?
- 介绍整个项目的流程
- 介绍项目的数据域和业务的总线矩阵
- 我有做过数据治理吗
- 有过hive性能优化的经验吗
- 你们是用的是什么建模?
- 维度建模中那个缓慢维度变化为都有哪几种应对方式?
- 我的拉链表是怎么查看历史数据的
## 八股
- yarn的基础架构和基本角色
- 分享了一个spark任务提交的过程
- 分别讲讲yarn的资源调度策略
- 我们用的什么资源调度器
- 用的开源Yarn还是CDH yarn
## 手撕
```sql
有 msg_time,from,to, msg等字段,计算聊天两轮(用户消息一来一回表示一轮)以上的用户。
msg_time from to
2021-11-24 21:23:00 1 2
2021-11-24 21:23:01 2 1
2021-11-24 21:23:02 1 2
2021-11-24 21:23:03 2 1
2021-11-24 21:23:04 2 1
2021-11-24 21:23:01 3 1
2021-11-24 21:23:02 1 3
2021-11-24 21:23:03 3 1
2021-11-24 21:23:04 1 3
```
全部评论
相关推荐
点赞 评论 收藏
分享
04-19 17:52
清华大学 Python 点赞 评论 收藏
分享
点赞 评论 收藏
分享