百度搜索架构一面
聊聊实习,可能跨服太大,面试官不太感兴趣
问数据库索引,详细说一下,说了b+树
主键索引和非主键索引
回表,数据库的八股很久没复习了,回答的不是很好
场景题,
有个文件有40亿行数据,每行key value,key可能重复。怎么有什么办法输出map[key]对应所有的value。
思路1:按大数据排序的思路,排序自然就能分类了。时间复杂度高
思路2:因为不要求顺序,可以通过hash,把文件划分成小文件
单机存大批量kv存不下,应该怎么办,有什么优化
讲了用分布式,分开存储,用hash去划分存储的主机。
分布式大批量查询怎么优化,不使用多副本
加缓存,对于热点数据缓存起来,但是需要对查询计数得到热点数据,lru(面试官说lru对热点数据不那么有用)
写数据尽量负载均衡
代码题
写一个加过期策略的lru
简单的写了个不带过期策略的,加过期策略时候如流卡死了,就让叙述一下思路。
回答get时候删除过期,存在大批量过期怎么解决?定期或者超出容量删除,面试官不太满意。问还有什么策略不用扫描全部kv,不知道。
问redis过期策略怎么做的,回答不知道
算是第一个面的大厂吧,很多八股忘完了,数据库,redis忘的差不多,回表都忘了是啥了,深刻教训,开始狠狠地补😂
问数据库索引,详细说一下,说了b+树
主键索引和非主键索引
回表,数据库的八股很久没复习了,回答的不是很好
场景题,
有个文件有40亿行数据,每行key value,key可能重复。怎么有什么办法输出map[key]对应所有的value。
思路1:按大数据排序的思路,排序自然就能分类了。时间复杂度高
思路2:因为不要求顺序,可以通过hash,把文件划分成小文件
单机存大批量kv存不下,应该怎么办,有什么优化
讲了用分布式,分开存储,用hash去划分存储的主机。
分布式大批量查询怎么优化,不使用多副本
加缓存,对于热点数据缓存起来,但是需要对查询计数得到热点数据,lru(面试官说lru对热点数据不那么有用)
写数据尽量负载均衡
代码题
写一个加过期策略的lru
简单的写了个不带过期策略的,加过期策略时候如流卡死了,就让叙述一下思路。
回答get时候删除过期,存在大批量过期怎么解决?定期或者超出容量删除,面试官不太满意。问还有什么策略不用扫描全部kv,不知道。
问redis过期策略怎么做的,回答不知道
算是第一个面的大厂吧,很多八股忘完了,数据库,redis忘的差不多,回表都忘了是啥了,深刻教训,开始狠狠地补😂
全部评论
经典如流卡死
抓turkey哥 前排喝可乐
约2面了
相关推荐
投票
点赞 评论 收藏
分享