小红书 存储

一面 8/6

leveldb

  • 导致 write stall 的原因
  • leveldb 写入是顺序写入吗
  • 多线程并发的时候,leveldb 能保证顺序写吗?

阿里实习

  • 介绍顺序流识别的算法流程
  • split/move 操作的实现,是原子的吗
  • 为什么 bwtree 相比 lsmtree 的 list 性能好

天池比赛

  • 对热点key缓存的实现
  • hash table 的优化
  • 读写流程?

raft

  • 选主逻辑
  • 出现网络分区,会脑裂吗
  • 新 leader 上线怎么继续去日志复制
  • raft 这种协议要满足奇数节点吗?面试官觉得是奇数,因为出现 2 2 的网络分区就不可用了,但其实 Quorum 不等于 majority,可以修改协议,实现偶数节点也能正常应对网络分区
  • raft leader 接受读写请求,如何优化?

算法

  • 实现一个拉链法的 hashTable

二面 8/6

阿里云实习

  • 顺序流算法的实现
  • 对随机读写导致的热点的partiiton调度?
  • oss 的架构,讲了下基于 arkdb 做的一套新的分布式kv

阿里天池

  • 比赛的分工
  • 介绍了对 hashtable 的优化

算法

  • 给一个字符串 “010101”,把它变成非递减的,比如 “000111”,最少需要多少次交换(一次快速选择)

三面 HR 8/16

四面 9/4

大概20min,主要问了下阿里实习经历和实验室项目

#小红书#
全部评论
大佬oc了吗
点赞 回复 分享
发布于 2023-09-18 02:22 湖北

相关推荐

11-15 15:46
兰州大学 C++
点赞 评论 收藏
分享
全流程介绍:在BOSS上投的简历,第一天投第二天约一面(约到了两天后)当天HR通知我顺利通过面试,问我什么时候约二面,于是我就约到了当天晚上。当天二面完后半小时后HR通知二面顺利通过,说需要加一轮技术面,问我什么时间合适。当时已经周五,所以三面约到了下周一。周一上午面完三面,下午HR通知顺利通过,问我什么时候有时间参与下HR面。于是约到了三面的当天晚上。面试官表示两个工作日之内会收到offer。不得不说字节的HR效率是真的高,借此机会我将自己一二三面做整理;以来是有个记录、二来希望可以帮到之后的兄弟姐妹们。  1、自我介绍    讲了一下自己的当前情况,介绍了一下对大数据开发两个方向上的理解;介绍了下自己的一段滴滴实习经历+自己写的项目。表示了自己会有写技术博客的习惯,取得了4W+阅读量此外粉丝量也即将达到2K人。  2、深挖两个项目 - 大部分时间    面试官对实习经历特别感兴趣,我提到了几个亮点:Spark调优+物化视图中间层建设+实时数仓经历,都被扒了个底朝天。此外面试官还会根据你写的项目来问你八股的问题,比如我分布式文件系统的项目,他问我使用什么数据结构来存储元数据的,我回答说HashMap,于是他就问了HasMap的底层原理。(大家在准备的时候一定要好好准备)  3、计算机网络中:在地址框输入域名后到页面展示经过了什么?    绝了,还好考研的时候学过没忘哈哈哈  4、Bloom Filter与BitMap    巧了,虽然BitMap没接触过,但是Bloom Filter在学习HBase的时候学过,所以答得还可以。作用、存在什么问题..应用场景等等。  5、HashMap底层原理    刚好复习到了这个知识点,因为上一次找实习的时候,当时是第一次面试,美团面试官也是根据我的项目问出了这个题。(所以说大家一定要好好准备项目相关八股)。  6、StarRocks中的表模型    提前准备了,面试的时候往这上面引导,面试官顺理成章的问了,我也顺理成章的答了出来。  7、StarRocks如何实现更新 (读时更新、写时更新)    这个地方不是很了解,面试官跟我讲了一下:Merge-on-Read和Merge-on-Write  8、StarRocks中的关联方式    这里答了出来,但是没答全;面试官同样跟我讲了一下;全程和蔼,可以让面试者很轻松自信。  代码题 ;动态规划,最小子数组和问题    没什么好说的,给我简单爽了。  面试时长55分钟,很无奈我找到是数仓实习,这个岗位却是做计算引擎开发(属于后端开发范畴);本来以为凉了,但是面试官表示开发技术不是问题,进去之后会进行培养。在这里给自己的CSDN打一波广告,欢迎大家参考!:   https://ansentai.blog.csdn.net/
查看9道真题和解析
点赞 评论 收藏
分享
10-29 11:45
东北大学 C++
一面:操作系统下面有个proc目录,讲一下这个目录中管理的都是什么?运行中的进程都有一个以其 PID 为名的子目录,我要查看这个进程的CPU占用怎么看?top命令,它是怎么做到能看到整机资源的?现在写一些C++项目,部署到服务器上,他现在出现了OM,它被cue了,那这个时候需要排查一下这个问题怎么排查?根据你了解的操作系统和命令的话如果有一个学生表student,有四个字段,student,score,age,class,求每个班age大于18的人数sql语句怎么写?讲解一下锁的可重入性介绍一下grpc,json和protobuf的实现、区别,应用场景。设计一个类似的应用场景。讲解一下MySQL的索引,有什么优点加索引之后查找方式?B+树场景下怎么进行的查表过程索引使用B+树它的优势是什么?假设我们对一个text字段做了索引,那么这个时候它的查找速度会不会快?如果快或者不快的话,它是一个怎么寻址的过程?比如说他在寻址过程中要二分,他是根据什么去做的?二分怎么做的排序?一张表中对性别见了索引,它的缺点是什么样子,数据呈现是什么样子,为什么他快不了?讲一下对拥塞控制的理解为什么要修改门限值?不修改门限会有什么问题?手撕:查找第K个最大值二面:groupcache和redis的区别是什么?讲一下你理解的SQL优化有哪些?为什么索引失效会影响性能?MySQL索引的存在形式是什么?在Linux上,僵尸进程是怎么形成的?讲解一下Go的GMP和垃圾回收机制Linux如何查看一个进程的信息?一般进程的信息都有哪些Linux系统里面他的文件权限系统是怎么样的?怎么控制它的文件权限,哪些值分别代表什么意思?一般655是什么权限?介绍一下TCP/IP网络模型手撕:用golang写一下你项目中的某一块核心代码(忘得差不多,提问不能cpp? 面试官:只能golang,写的太烂挂 )。
查看28道真题和解析
点赞 评论 收藏
分享
4 20 评论
分享
牛客网
牛客企业服务