程序员面试之数据库基础架构

数据库是校招面试中的重点,也是难点。这一块各位同学需要详细并且深入掌握,今天给大家聊聊数据库的基础架构部分,希望对大家有所帮助。

1、你知道MySQL的基本架构么?你能在纸上给我大致画出这个示意图么?

alt
先来看连接器是啥,我们要进行查询,第一步就是先去链接数据库,那这个时候就是连接器跟我们对接。
它负责跟客户端建立链接、获取权限、维持和管理连接。
链接的时候会经过TCP握手,然后身份验证,然后我们输入用户名密码就好了。
验证ok后,我们就连上了这个MySQL服务了,但是这个时候我们处于空闲状态。

2、怎么查看空闲连接列表?

show processlist,下图就是我在自己的数据库表执行命令的结果,其中的Command列显示为Sleep的这一行,就表示现在系统里面有一个空闲连接。 alt 这里需要注意的是,我们数据库的客户端太久没响应,连接器就会自动断开了,这个时间参数是wait_timeout控制住的,默认时长为8小时。
断开后重连的时候会报错,如果你想再继续操作,你就需要重连了。

一个在政府里的朋友说,他们的系统很奇怪,每天早上都得重启一下应用程序,否则就提示连接数据库失败,他们都不知道该怎么办。

按照这个错误提示,应该就是连接时间过长了,断开了连接。
数据库默认的超时时间是8小时,而他们平时六点下班,下班之后系统就没有人用了,等到第二天早上九点甚至十点才上班,这中间的时间已经超过10个小时了,数据库的连接肯定就会断开了。
是的,就是超出了超时时间,然后写代码的人也没注意到这个细节,所以才会出现这个问题。

把超时时间改得长一点,问题就解决了。

这种参数其实我们平时不一定能接触到,但是真的遇到问题的时候,知道每个参数的大概用法,不至于让你变成无头苍蝇。

3、那除了重新链接,还有别的方式么?因为建立链接还是比较麻烦的。

使用长连接

但是这里有个缺点,使用长连接之后,内存会飙得很快,我们知道MySQL在执行过程中临时使用的内存是管理在连接对象里面的。

只有在链接断开的时候才能得到释放,那如果一直使用长连接,那就会导致OOM(Out Of Memory),会导致MySQL重启,在JVM里面就会导致频繁的Full GC。

4、那怎么解决长连接OOM问题?

一般需要定期断开长连接,使用一段时间后,或者程序里面判断执行过一个占用内存比较大的查询后就断开连接,需要的时候重连就好了。

5、还有别的方法么?

  • 执行比较大的一个查询后,执行mysql_reset_connection可以重新初始化连接资源。这个过程相比上面一种会好点,不需要重连,但是会初始化连接的状态。
  • 使用Mysql连接池

6、了解MySQL的查询缓存吗?

MySQL拿到一个查询请求后,会先到查询缓存看看,之前是不是执行过这条语句。

同一条语句在MySQL执行两次,第一次和后面的时间是不一样的,后者明显快一些,这就是因为缓存的存在。

他跟Redis一样,只要是你之前执行过的语句,都会在内存里面用key-value形式存储着。

查询的时候就会拿着语句先去缓存中查询,如果能够命中就返回缓存的value,如果不命中就执行后面的阶段。

但是推荐不要使用缓存,因为缓存弊大于利。

7、为什么不推荐使用缓存?

缓存的失效很容易,只要对表有任何的更新,这个表的所有查询缓存就会全部被清空,就会出现缓存还没使用,就直接被清空了,或者积累了很多缓存准备用来着,但是一个更新打回原形。

这就导致查询的命中率低的可怕,只有那种只查询不更新的表适用缓存,但是这样的表往往很少存在,一般都是什么配置表之类的。

8、那我们查询的时候不想用缓存一般都是怎么操作的,或者是用缓存又怎么操作?

可以显示调用,把query_cache_type设置成为DEMAND,这样SQL默认不适用缓存,想用缓存就用SQL_CACHE。

有个小技巧就是,我们之前开发的时候,都会去库里看看sql执行时间,但是可能是有缓存的,一般我们就在sql前面使用SQL_NO_CACHE就可以知道真正的查询时间了。

select SQL_NO_CACHE * from B 缓存在MySQL8.0之后就取消了,所以大家现在应该不需要太关注这个问题,主要是我之前用的版本都不高,所以缓存一直有,在《高性能MySQL》书中也看到了一些关于缓存的介绍。

9、缓存查询完了应该做啥呢?

在缓存没有命中的情况下,就开始执行语句了,你写的语句有没有语法错误,这是接下来MySQL比较关心的点。

那他会怎么做呢?会先做词法分析,你的语句有这么多单词、空格,MySQL就需要识别每个字符串所代表的是什么,是关键字,还是表名,还是列名等等。

然后就开始语法分析,根据词法分析的结果,语法分析会判断你sql的对错,错了会提醒你的,并且会提示你哪里错了。

分析没错之后就进入下一步,优化器。

10、主要是优化什么?

优化就比较简单了,因为我们建立表可能会建立很多索引,优化有一步就是要确认使用哪个索引,比如使用你的主键索引,联合索引还是什么索引更好。

还有就是对执行顺序进行优化,条件那么多,先查哪个表,还是先关联,会出现很多方案,最后由优化器决定选用哪种方案。

最后就是执行了,执行就交给执行器去做。

第一步可能就是权限的判断,其实这里我不确定的一个点就是,我接触的公司很多都是自研的线上查询系统,我们是不能用Navicat直连线上库,只能去网页操作,那表的权限是在MySQL层做的,还是系统做的,我猜应该是系统层做的,MySQL可能默认就全开放了,只是我们 不知道ip。

执行的时候,就一行一行的去判断是否满足条件,有索引的执行起来可能就好点,一行行的判断就像是接口都提前在引擎定义好了,所以他比较快。

数据库的慢日志有个rows_examined字段,扫描多少行可以看到,还有explain也可以看到执行计划,我们扫描了多少行。

专业的面试官在技术面试时都会采取由点到面,由浅入深的套路来面试,测试你的专业面和平时的思考。大家对八股文不要停留在背诵上,多从是什么、为什么、怎样做的三个维度来思考相关知识点。

我后面会每周都更新几篇技术和面试技巧系列,非常感谢同学们能看到这里,如果觉得这个文章写得还不错,求点赞👍 求关注❤️ 求分享👥

创作不易,各位的支持和认可,就是我创作的最大动力,我们下篇文章见!

#面试##面经##校招#
全部评论

相关推荐

三七互娱面经:    三人围攻(二人视频聊,最后还有一个用电话在视频里面聊) 自我介绍,有没有offer?为什么不去?为什么选择我们公司? 问项目。发现问的是旧项目,然后就自己说了一下新项目。项目的小细节,数据处理方面 逻辑回归的数学思想 有一个场景,想用朴素贝叶斯,但效果不好,怎么优化? 逻辑回归采用的是交叉熵,那你知道相对熵(KL)吗?逻辑回归为什么不用最小二乘?信息熵公式,说说联合熵的公式 xgb二阶泰勒展开,为什么不三阶? xgb的优点是什么? CART树和ID3区别?ID3的缺点?ID3换成基尼系数是否就没有这个缺点了?CART回归树和ID3是二叉树还是多叉树? 平时有什么爱好?读什么书? 和领导的意见不一致怎么办? 发现领导的想法是错的?你会怎么做?  面了40分钟,获益良多。技术深度还不够,继续努力吧~设计岗位还有HC!设计岗位还有HC!三七互娱2025届春季校园招聘正式启动啦,~投递简历通过会就有在线测评,大家一定要认真对待哈。简要介绍A股优秀综合型文娱上市公司、中国游戏厂商出海第一梯队、国家文化产业示范基地招聘岗位【游戏策划】【美术设计】【市场推广】【游戏运营类】【技术开发】▶内推码投递,简历优先筛选:DSpqRPZJ内推链接:https://app.mokahr.com/m/campus_apply/37/58016?recommendCode=DSpqRPZJ&hash=%23%2Fjobs                                                           大家投递完可以在评论区打上姓名缩写+岗位,我来确认有没有内推成功喽 #校招#         #内推#         #内推码#         #秋招#      
点赞 评论 收藏
分享
评论
9
9
分享

创作者周榜

更多
牛客网
牛客企业服务