bilibili_数开实习_一面
- 大数据基础架构部门
- 职责有点不匹配,全程被拷打了,根本不了解底层的事情
## 项目
- 数仓这一块目前总标准分层的一个概念,你这块熟悉吗?
- 你最后输出指标是什么样的?是新型模型还是雪花模型?
- 最后superset的引擎用的什么
- spark数据倾斜具体看的sparkUI哪一个指标哪一个参数
- local read数据量?shuffle read数据量?shuffle write数据量?
## 八股
- spark常见的shuffle策略,这些不同的策略分别在哪些项目中用到
- 常见的shuffle流程
- 他在系统层面有什么弊端,特别是面对高并发情况下
- Hive查询优化有什么方式
- SMB join是怎么具体实现的
- java相关的锁机制(其实就是锁机制)
- 乐观锁悲观锁
- 设计模式了解吗
- Java性能排查有没有什么SOP
## 高并发场景题
这个场景题完全不懂,也没怎么接触过,要求设计一个从数据基建到建模的整个思路来应对高并发的场景
- 职责有点不匹配,全程被拷打了,根本不了解底层的事情
## 项目
- 数仓这一块目前总标准分层的一个概念,你这块熟悉吗?
- 你最后输出指标是什么样的?是新型模型还是雪花模型?
- 最后superset的引擎用的什么
- spark数据倾斜具体看的sparkUI哪一个指标哪一个参数
- local read数据量?shuffle read数据量?shuffle write数据量?
## 八股
- spark常见的shuffle策略,这些不同的策略分别在哪些项目中用到
- 常见的shuffle流程
- 他在系统层面有什么弊端,特别是面对高并发情况下
- Hive查询优化有什么方式
- SMB join是怎么具体实现的
- java相关的锁机制(其实就是锁机制)
- 乐观锁悲观锁
- 设计模式了解吗
- Java性能排查有没有什么SOP
## 高并发场景题
这个场景题完全不懂,也没怎么接触过,要求设计一个从数据基建到建模的整个思路来应对高并发的场景
全部评论
相关推荐
04-14 17:10
中南财经政法大学 Java 点赞 评论 收藏
分享
点赞 评论 收藏
分享