bilibili_数开实习_一面

- 大数据基础架构部门
- 职责有点不匹配,全程被拷打了,根本不了解底层的事情

## 项目

- 数仓这一块目前总标准分层的一个概念,你这块熟悉吗?
- 你最后输出指标是什么样的?是新型模型还是雪花模型?
- 最后superset的引擎用的什么
- spark数据倾斜具体看的sparkUI哪一个指标哪一个参数
  - local read数据量?shuffle read数据量?shuffle write数据量?

## 八股

- spark常见的shuffle策略,这些不同的策略分别在哪些项目中用到
- 常见的shuffle流程
  - 他在系统层面有什么弊端,特别是面对高并发情况下
- Hive查询优化有什么方式
  - SMB join是怎么具体实现的
- java相关的锁机制(其实就是锁机制)
  - 乐观锁悲观锁
- 设计模式了解吗
- Java性能排查有没有什么SOP

## 高并发场景题

这个场景题完全不懂,也没怎么接触过,要求设计一个从数据基建到建模的整个思路来应对高并发的场景
全部评论

相关推荐

评论
4
14
分享

创作者周榜

更多
牛客网
牛客企业服务