字节大数据岗一面-面经
- 字节面经
- 项目的数据来源和的数据的规模
- Spark Shuffle
- spark的宽窄依赖
- 数据倾斜问题(★★★★★)
- 产生数据倾斜的原因
- 遇到过的数据倾斜的实际情况
- 数据倾斜的解决办法
- 产生数据倾斜的原因
- 介绍一下hadoop的NameNode
- NameNode高可用架构
- NameNode主节点宕机,之后的选取机制
- Zookeeper的选取机制
- NameNode中的元数据是否会丢失?(★★★★★)
- 怎么保证元数据不丢失
- 怎么保证元数据不丢失
- NameNode高可用架构
- Kafka实现主从数据的一致性
- 是否会造成数据的丢失?
- ISR队列
- 是否会造成数据的丢失?
- kafka实现高吞吐的原因
- 数据仓库分层的好处?
- SQL:求连续出现3次的数字
- 算法:字符串Z子型输出
- 项目的数据来源和的数据的规模
- 总结:从简历上的个人能力展开,项目问的很深,讲究一个知识的贯通性。