面试八股文对校招的用处有多大?Redis篇
前言
1.本系列面试八股文的题目及答案均来自于网络平台的内容整理,对其进行了归类整理,在格式和内容上或许会存在一定错误,大家自行理解。内容涵盖部分若有侵权部分,请后台联系,及时删除。
2.本系列发布内容分为12篇 分别是:
redis
服务器
RPG
本文为第十篇,后续会陆续更新。 共计200+道八股文。
3.本系列的200+道为整理的八股文系列的一小部分。完整整理完的八股文面试题共计1000+道,100W字左右,体量太大,故此处放至百度云盘链接: ***********************************************************
*******************
4.八股文对于面试的同学来说仅作为参考使用,不能作为面试上岸的唯一准备,还是要结合自身的技术能力和项目,同步发育。
01.redis有什么数据结构
- 字符串(String):二进制安全的字符串,最大512M。
- 列表(List):列表是简单的字符串列表,按照插入顺序排序。可以添加一个元素到列表的头部(左侧),或者尾部(右侧)。
- 集合(Set):无序、唯一的字符串集合。可以进行交集、并集、差集等操作。
- 有序集合(Sorted Set):与Set类似,但是每个元素都关联了一个权重值(score),可以根据权重值进行排序。
- 哈希(Hash):键值对集合,其中键和值都是字符串类型。适用于存储对象。
- 消息队列(Pub/Sub):基于发布/订阅模式实现消息通信机制。
02.设计一个存储字符串kv对的数据结构,要考虑并发和持久化存储
一个存储字符串kv对的数据结构可以使用哈希表来实现,其中键为字符串类型,值为字符串类型。在考虑并发和持久化存储时,可以采取以下方案:
- 并发:使用分布式锁或者乐观锁来保证并发情况下数据的一致性。对于高并发场景,可以考虑将数据进行分片处理。
- 持久化存储:可以采用日志记录方式进行持久化存储。即每当有新的键值对插入或更新时,先将操作记录到磁盘上的日志文件中,在内存中更新哈希表。如果系统重启后内存中的数据丢失,则可通过读取日志文件恢复数据。
03.redis 基本数据结构... zset-> zset 底层实现?-> skiplist 和 red-black tree 对比?
1.概述
zset底层的存储结构包括ziplist或skiplist,在同时满足以下两个条件的时候使用ziplist,其他时候使用skiplist,两个条件如下:
- 有序集合保存的元素数量小于128个
- 有序集合保存的所有元素的长度小于64字节
当ziplist作为zset的底层存储结构时,每个集合元素使用两个紧挨在一起的压缩列表结点来保存,第一个结点保存元素的成员,第二个结点保存元素的分值。
当skiplist作为zset的底层存储结构的时候,使用skiplist按序保存元素及分值,使用dict来保存元素和分值的映射关系。
2.ziplist数据结构
ziplist作为zset的存储结构时,格式如下图:
紧挨着的时元素member个分值score,整体数据是有序格式。
3.skiplist数据结构
skiplist作为zset的存储结构,整体存储结构如下图。核心点主要包括一个dict对象和一个skiplist对象。dict保存key/value,key为元素,value为分值;skiplist保存的有序的元素列表,每个元素包括元素和分值。两种数据结构下的元素指向相同的位置。
skiplist的源码
zset包括dict和zskiplist两个数据结构,其中dict的保存key/value,便于通过key(元素)获取score(分值)。zskiplist保存有序的元素列表,便于执行range之类的命令。
/*
* 有序集合
*/
typedef struct zset {
// 字典,键为成员,值为分值
// 用于支持 O(1) 复杂度的按成员取分值操作
dict *dict;
// 跳跃表,按分值排序成员
// 用于支持平均复杂度为 O(log N) 的按分值定位成员操作
// 以及范围操作
zskiplist *zsl;
} zset;
zskiplist作为skiplist的数据结构,包括指向头部的header指针和尾部的tail指针,其中level保存skiplist的最大的层数。
/*
* 跳跃表
*/
typedef struct zskiplist {
// 表头节点和表尾节点
struct zskiplistNode *header, *tail;
// 表中节点的数量
unsigned long length;
// 表中层数最大的节点的层数
int level;
} zskiplist;
skiplist跳跃表中每个节点的数据格式,每个节点有:保存数据的robj指针,分值score字段,后退指针backward便于回溯,zskiplistLevel的数组保存跳跃列表每层的指针。
/*
* 跳跃表节点
*/
typedef struct zskiplistNode {
// 成员对象
robj *obj;
// 分值
double score;
// 后退指针
struct zskiplistNode *backward;
// 层
struct zskiplistLevel {
// 前进指针
struct zskiplistNode *forward;
// 跨度
unsigned int span;
} level[];
} zskiplistNode;
zset的存储过程 zset的添加过程,以zadd的操作为例进行分析,整个过程如下:
- 解析参数得到每个元素及其对应的分值;
- 查找key对应的zset是否存在,不存在则创建;
- 如果存储格式是ziplist,那么在执行添加的过程中我们需要区分元素存在和不存在两种情况:
- 存在的情况下,先删除再添加;
- 不存在的情况下,添加,并且需要考虑元素的长度是否超出限制或实际已有的元素个数是否超过最大限制进而决定是否转为skiplist对象。
- 如果存储个税是skiplist,那么在执行添加的过程中我们需要区分元素存在和不存在两种情况:
- 存在的情况下线删除后添加;
- 不存在情况下那么久直接添加,在skiplist当中添加完以后我们同事需要更新dict对象。
void zaddGenericCommand(redisClient *c, int incr) {
static char *nanerr = "resulting score is not a number (NaN)";
robj *key = c->argv[1];
robj *ele;
robj *zobj;
robj *curobj;
double score = 0, *scores = NULL, curscore = 0.0;
int j, elements = (c->argc-2)/2;
int added = 0, updated = 0;
// 输入的 score - member 参数必须是成对出现的
if (c->argc % 2) {
addReply(c,shared.syntaxerr);
return;
}
// 取出所有输入的 score 分值
scores = zmalloc(sizeof(double)*elements);
for (j = 0; j < elements; j++) {
if (getDoubleFromObjectOrReply(c,c->argv[2+j*2],&scores[j],NULL)
!= REDIS_OK) goto cleanup;
}
// 取出有序集合对象
zobj = lookupKeyWrite(c->db,key);
if (zobj == NULL) {
// 有序集合不存在,创建新有序集合
if (server.zset_max_ziplist_entries == 0 ||
server.zset_max_ziplist_value < sdslen(c->argv[3]->ptr))
{
zobj = createZsetObject();
} else {
zobj = createZsetZiplistObject();
}
// 关联对象到数据库
dbAdd(c->db,key,zobj);
} else {
// 对象存在,检查类型
if (zobj->type != REDIS_ZSET) {
addReply(c,shared.wrongtypeerr);
goto cleanup;
}
}
// 处理所有元素
for (j = 0; j < elements; j++) {
score = scores[j];
// 有序集合为 ziplist 编码
if (zobj->encoding == REDIS_ENCODING_ZIPLIST) {
unsigned char *eptr;
// 查找成员
ele = c->argv[3+j*2];
if ((eptr = zzlFind(zobj->ptr,ele,&curscore)) != NULL) {
// 成员已存在
// ZINCRYBY 命令时使用
if (incr) {
score += curscore;
if (isnan(score)) {
addReplyError(c,nanerr);
goto cleanup;
}
}
// 执行 ZINCRYBY 命令时,
// 或者用户通过 ZADD 修改成员的分值时执行
if (score != curscore) {
// 删除已有元素
zobj->ptr = zzlDelete(zobj->ptr,eptr);
// 重新插入元素
zobj->ptr = zzlInsert(zobj->ptr,ele,score);
// 计数器
server.dirty++;
updated++;
}
} else {
// 元素不存在,直接添加
zobj->ptr = zzlInsert(zobj->ptr,ele,score);
// 查看元素的数量,
// 看是否需要将 ZIPLIST 编码转换为有序集合
if (zzlLength(zobj->ptr) > server.zset_max_ziplist_entries)
zsetConvert(zobj,REDIS_ENCODING_SKIPLIST);
// 查看新添加元素的长度
// 看是否需要将 ZIPLIST 编码转换为有序集合
if (sdslen(ele->ptr) > server.zset_max_ziplist_value)
zsetConvert(zobj,REDIS_ENCODING_SKIPLIST);
server.dirty++;
added++;
}
// 有序集合为 SKIPLIST 编码
} else if (zobj->encoding == REDIS_ENCODING_SKIPLIST) {
zset *zs = zobj->ptr;
zskiplistNode *znode;
dictEntry *de;
// 编码对象
ele = c->argv[3+j*2] = tryObjectEncoding(c->argv[3+j*2]);
// 查看成员是否存在
de = dictFind(zs->dict,ele);
if (de != NULL) {
// 成员存在
// 取出成员
curobj = dictGetKey(de);
// 取出分值
curscore = *(double*)dictGetVal(de);
// ZINCRYBY 时执行
if (incr) {
score += curscore;
if (isnan(score)) {
addReplyError(c,nanerr);
goto cleanup;
}
}
// 执行 ZINCRYBY 命令时,
// 或者用户通过 ZADD 修改成员的分值时执行
if (score != curscore) {
// 删除原有元素
redisAssertWithInfo(c,curobj,zslDelete(zs->zsl,curscore,curobj));
// 重新插入元素
znode = zslInsert(zs->zsl,score,curobj);
incrRefCount(curobj); /* Re-inserted in skiplist. */
// 更新字典的分值指针
dictGetVal(de) = &znode->score; /* Update score ptr. */
server.dirty++;
updated++;
}
} else {
// 元素不存在,直接添加到跳跃表
znode = zslInsert(zs->zsl,score,ele);
incrRefCount(ele); /* Inserted in skiplist. */
// 将元素关联到字典
redisAssertWithInfo(c,NULL,dictAdd(zs->dict,ele,&znode->score) == DICT_OK);
incrRefCount(ele); /* Added to dictionary. */
server.dirty++;
added++;
}
} else {
redisPanic("Unknown sorted set encoding");
}
}
if (incr) /* ZINCRBY */
addReplyDouble(c,score);
else /* ZADD */
addReplyLongLong(c,added);
cleanup:
zfree(scores);
if (added || updated) {
signalModifiedKey(c->db,key);
notifyKeyspaceEvent(REDIS_NOTIFY_ZSET,
incr ? "zincr" : "zadd", key, c->db->id);
}
}
04.对于redis的理解
redis是一个开源的使用ANSI C语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库,并提供多种语言的API。和Memcached类似。redis支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)和zset(有序集合)。
一、 基本介绍
redis是一个key-value存储系统。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)和zset(有序集合)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。在此基础上,redis支持各种不同方式的排序。与memcached一样,为了保证效率,数据都是缓存在内存中。区别的是redis会周期性的把更新的数据写入磁盘或者把修改操作写入追加的记录文件,并且在此基础上实现了master-slave(主从)同步。
Redis 是一个高性能的key-value数据库。 redis的出现,很大程度补偿了memcached这类keyvalue存储的不足,在部 分场合可以对关系数据库起到很好的补充作用。它提供了Python,Ruby,Erlang,PHP客户端,使用很方便。
二、 常用命令
就DB来说,Redis成绩已经很惊人了,且不说memcachedb和tokyocabinet之流,就说原版的memcached,速度似乎也只能达到这个级别。Redis根本是使用内存存储,持久化的关键是这三条指令:SAVE BGSAVE LASTSAVE …
当接收到SAVE指令的时候,Redis就会dump数据到一个文件里面。
值得一说的是它的独家功能:存储列表和集合,这是它与mc之流相比更有竞争力的地方。
不介绍mc里面已经有的东东,只列出特殊的:
TYPE key — 用来获取某key的类型
KEYS pattern — 匹配所有符合模式的key,比如KEYS * 就列出所有的key了,当然,复杂度O(n)
RANDOMKEY – 返回随机的一个key
RENAME oldkey newkey — key也可以改名
列表操作,精华
RPUSH key string — 将某个值加入到一个key列表头部
LPUSH key string — 将某个值加入到一个key列表末尾
LLEN key — 列表长度
LRANGE key start end — 返回列表中某个范围的值,相当于mysql里面的分页查询那样
LTRIM key start end — 只保留列表中某个范围的值
LINDEX key index — 获取列表中特定索引号的值,要注意是O(n)复杂度
LSET key index value — 设置列表中某个位置的值
三、 redis存储
redis使用了两种文件格式:全量数据和增量请求。全量数据格式是把内存中的数据写入磁盘,
便于下次读取文件进行加载;增量请求文件则是把内存中的数据序列化为操作请求,用于读取文件进行replay得到数据,序列化的操作包括SET、RPUSH、SADD、ZADD。
redis的存储分为内存存储、磁盘存储和log文件三部分,配置文件中有三个参数对其进行配置。
save seconds updates,save配置,指出在多长时间内,有多少次更新操作,就将数据同步到数据文件。这个可以多个条件配合,比如默认配置文件中的设置,就设置了三个条件。
appendonly yes/no ,appendonly配置,指出是否在每次更新操作后进行日志记录,如果不开启,可能会在断电时导致一段时间内的数据丢失。因为redis本身同步数据文件是按上面的save条件来同步的,所以有的数据会在一段时间内只存在于内存中。
appendfsync no/always/everysec ,appendfsync配置,no表示等操作系统进行数据缓存同步到磁盘,always表示每次更新操作后手动调用fsync()将数据写到磁盘,everysec表示每秒同步一次。
05.redis在项目中进行怎么样的使用
Redis是一个使用内存存储的开源的高性能数据库,以读取,写入,更新,删除等操作来支持灵活的数据模型,可以帮助我们高效地实现利用程序中多种功能。在项目中正确使用Redis,可以给项目带来巨大的便利。那末,我们应当如何正确使用Redis呢?
首先,在使用Redis时,需要注意的是Redis的存储机制,它支持五种主要的数据类型,分别是string,hash,list,set,zset,它们分别对应区别的存储情势,它们可让我们更加高效的使用Redis。
第二,在使用Redis的时候有一些技能,比如使用pipelining和pub-sub,可使得Redis的性能更好,而且在项目中使用它可以帮助我们更快更高效地处理数据。
第三,在使用Redis时,要公道利用Redis的key/value结构,这样可让我们可以更快更方便地获得数据,而且对复杂的查询,可使用Redis的哈希结构,这样可让我们更容易索引。
最后,一定要优化Redis,包括清算无用的key,定期备份,优化GC,开启Aof和RDB等。这样可让Redis更加高效地工作,带来更好的性能。
在结束之前,我还想补充一点,如果以上方法都不能满足项目的需求的话,可以斟酌使用内存驱动的Redis替换原本的Redis,它可以带来更快的速度,并且减少项目的技术支持本钱。
总的来讲,若要在项目中正确的使用Redis,应当从数据类型,技能,优化等多方面来斟酌,依照以上方法,就能够让我们可以更加高效充分发挥Redis的优势,为我们带来更大的便利。
06.redis 为什么读取速度那么块 (io、单线程、内存)
Redis为什么这么快 Redis的读取速度为110000次/s,写的速度为81000次/s
1.Redis将数据存储在内存里面,读数据的时候都不会收到硬盘IO速度的限制,所以速度极快
2.数据在内存中,类似于HashMap,查找和操作的时间复杂度都是O(1)
3.数据结构简单,对数据操作也简单,Redis中的数据结构是专门进行设计的
4.采用单线程,避免了不必要的上下文切换和竞争条件,也不存在多进程或者多线程导致的切换消耗CPU,不用去考虑各种锁的问题,不用考虑锁的问题,不存在加锁释放锁的操作,没有因为可能出现死锁而导致的性能消耗
5.使用多路IO复用模型,非阻塞IO
这里的多路指的是多个网络连接,复用是指的同一个线程,采用多路IO复用技术可以让耽搁线程高效的处理多个连接请求(尽量减少网络IO的时间消耗),且Redis在内存中操作数据的速度非常快,也就是说内存内的操作不会成为影响Redis性能的平静,主要由以上几点造就了Redis具有很高的吞吐量
6.使用底层模型不同,他们之间底层实现方式以及与客户端之间通信的应用协议不一样,Redis直接自己构建了VM机制,因为一般系统调用系统函数的话,会浪费一定的时间去移动和请求
07.为什么redis单线程会快 (完全基于内存、单线程避免不必要的上下文切换、cpu消耗、加锁问题。。。)
一、为什么Redis是单线程的? Redis 是基于内存的操作,而CPU 不是 Redis 的瓶颈。Redis 的瓶颈最有可能是机器内存的
大小或者网络带宽。同时,单线程的实现更加简单和经济,采用单线程可以使指令串行,不用额外
维护锁机制,避免了不必要的上下文切换和竞争条件,减少了CPU的消耗。
二、Redis有多快? Redis采用的是基于内存的采用的是单进程单线程模型的 KV 数据库,由C语言编写,官方提
供的数据是可以达到10W+的QPS(每秒内查询次数)。
三、Redis为什么可以达到这么快? 1.Redis完全基于内存,大部分操作都是在内存中完成的;
2.采用单线程:避免了不必要的上下文切换和竞争条件,也不存在多进程或者多线程导致的切
换而消耗 CPU,不用去考虑各种锁的问题,不存在加锁释放锁操作,没有因为可能出现死锁而导
致的性能消耗;
3.使用多路I/O复用模型,非阻塞IO:Redis可以在单线程中监听多个Socket的请求,在任意一
个Socket可读/可写时,Redis去读取客户端请求,在内存中操作对应的数据,然后再写回到Socket
中。;
4.非CPU密集型任务:Redis的瓶颈受限于内存和网络宽带,在高并发的请求下,Redis需要
更多的内存空间和更快的网络,否则这会导致瓶颈很容易出现在内存不够用和网络延迟等待的情
况,当Redis实例不满足使用时,可以通过部署多个Redis节点。或者搭建CPU集群的方式利用多
核的CPU。
四、单线程Redis的缺点? 1.内存空间受限,只能用于小数据量的高性能操作;
2.用于缓存时,易出现'缓存雪崩','缓存击穿'等问题;
3.无法发挥多核CPU性能,不过可以通过在单机开多个Redis实例来完善。
五、Redis为什么不采用多进程或是多线程进行处理? 1.多线程处理可能涉及到锁。
2.多线程处理会涉及到线程切换而消耗 CPU。
08.对于很多文件和数据,怎么进行数据的查找、排序,使用什么样的数据结构 (类似于TopK、这个主要是让你进行优化、类似于位图、hash、过滤器之类的)
对于大量的文件和数据,进行数据的查找和排序可以使用以下几种数据结构:
- 哈希表:哈希表是一种基于键值对存储的数据结构,可以快速进行查找、插入和删除操作。在哈希表中,每个元素都有一个唯一的键值,通过哈希函数将这个键值映射到一个桶中。因为哈希函数是均匀分布的,所以可以保证元素被均匀地分配到各个桶中。在需要查找或修改某个元素时,只需要先计算出它对应的桶号,然后再在该桶中进行查找或修改即可。
- 二叉搜索树:二叉搜索树是一种基于比较大小关系存储的数据结构,在插入、删除和查找等操作上具有很好的性能表现。在二叉搜索树中,每个节点都包含一个关键字及其对应的值,并且左子树上所有节点的关键字小于当前节点的关键字,右子树上所有节点的关键字大于当前节点的关键字。因此,在进行查找时可以通过比较大小逐步缩小搜索范围。
- 堆:堆是一种基于完全二叉树实现的数据结构,在插入、删除和查找最大或最小元素等操作上具有很好的性能表现。在堆中,每个节点的值都大于或小于其子节点的值,因此可以通过调整堆的结构来维护最大或最小元素。堆可以采用数组实现,也可以采用二叉树实现。
- 归并排序:归并排序是一种基于分治思想实现的排序算法,它将待排序序列不断地分割成两个子序列,并对这两个子序列进行递归排序,最后将排好序的两个子序列合并起来。归并排序具有稳定、快速和可靠的特点,在处理大量数据时性能表现良好。