顺丰科技|大数据平台研发|一面
- 了解哪些大数据组件
- Shuffle 的作用是什么
- Shuffle 中合并的操作有什么用/好处
- MapReduce 中出现数据倾斜怎么处理
- Yarn 有哪几个比较重要的进程
- ResourceManager 主要的作用
- ApplicationMaster 主要的作用
- 任务的监控在哪个进程
- ZooKeeper leader选举机制
- ZooKeeper 读写一致性具体体现在哪些地方
- Spark 宽窄依赖
- Spark Stage 是怎么划分的
- TaskScheduler 任务调度规则,Task 的优先级是怎么定义的
- Flink 窗口函数的作用
- 场景:两条数据流,其中一条比另一条快,合并不了的数据怎么处理
- 为什么项目选用 ClickHouse
- ClickHouse 分片、备份原理
- 其他OLAP 引擎了解吗(Presto、Impala)
- Java 线程生命周期
- 怎么阻塞、唤醒线程
- 用过哪些线程池
- ThreadLocal 原理
- synchronized 和 ReentrantLock 的区别
- Java 多态
- 抽象类和接口的区别
- Kafka 如何高效读写数据、保证数据去重
- Kafka 怎么保证数据顺序读
- MySQL索引,B+树和Hash的区别
- 写一条SQL有可能命中几条索引,索引的命中规则是什么
- 反问