字节 - 分布式存储(日常实习)
一面 2022.11.3
- 介绍存储项目
- 介绍了阿里天池比赛
- 问了下 MVCC 的实现
- 做题:双向链表排序
二面 2022.11.9
问了下项目,做了个题就结束了
- 深挖项目
- 算法题:topK
三面 2022.11.10
- 问了存储项目
- 问了阿里云天池比赛
- 算法题:判断树B是否是树A的子树,问了下时间,空间复杂度。
四面 2022.11.15
- 自我介绍
- 问了下分布式存储的设计要考虑什么?
- 问了下数据库和分布式存储的区别?
- 问了下如何针对 ls,select这些操作进行优化?
- 元数据服务器能做分片吗?怎么做
- 高可用怎么做?
- 分布式kv怎么实现?
- 怎么实现一致性?
- 问了下raft 和 paxos区别?
- 问了下 kv存储引擎怎么实现?
- levelDB 读写?
- levelDB 怎么做 GC ?
- levelDB 这种读写放大怎么解决的?
- 介绍下比赛。
- 问我了不了解 rdma,问我 rdma 几种协议?
- 问了下 EC,优劣?
- 问了下什么场景用 EC ?
- 问了下 EC 的一些实现算法?
- 操作系统了解吗? 我说了解 IO 栈,然后介绍了下 IO 栈
- 访问进程的地址空间流程,怎么变到访问内存芯片的?
- 页表实现?
- 那不同进程的地址空间怎么隔离开呢?
- 追问 page cache ,虚拟地址空间,页表怎么联系在一起的呢?
- 场景题:一个PB级别的大文件,然后找出最高频的10个单词。
- 算法题:树的Z字形层序遍历。