赐我白日梦

2021-07-22 10:51 已编辑百度_后端研发

关注

面试被问如何排查慢查询（执行计划）怎么办？愣着干嘛？进来白嫖呀！

一、阅读前

其实录制了一个视频专门讲解这篇文章，视频中讲的比下文还全哦

视频链接：

https://mp.weixin.qq.com/s/wGcODm6gfy6JOvkcKp-8MA

Oow！

想白嫖explain实战部分用到的建库SQL、存储过程等脚本可以通过上面的视频链接关注，后台回复：explain即可领取哦～

二、explain 实战

2.1、初识执行计划：

获取sql执行计划的语法：explain yoursql

explain select * from t1;

字段名	作用
id	sql中的每一个select都有一个未对应的id，对子查询来说，有多个select，就有多个id。
select_type	sql执行计划对应的查询类型。如： 1.针对单表查询或者是多表连接查询的select type是simple。 2.union语句针对前半部分sql的select_type为primary，针对后半部分sql的select_type为union，做去重时的select_type是union result。3.sql中出现子查询时，外层的select_type为primary，内层的select_type一般为subquery
table	你的sql要查询哪个表
partitions	分区表
type	针对该表查询时的查询方式。如： 1.聚簇索引的const 2.二级索引的查询ref（ref、eq_ref、ref_or_null）、range 3.对二级索引的全表扫描index 4.对聚簇索引的全表扫描的all
possible_keys	有哪些索引可以选择
key	实际选择的索引
key_len	索引的长度
ref	和上面选中key进行比较时，是等值匹配（const）还是其他的字段（库名.表名.列名）
rows	估算的可能会读取的数据条数
filtered	过滤比例，真实数据*过滤比例为预计将读取出来的数据
extra	额外的说明数据，如： 1.sql中有where条件时，Extra为：Using Where 2.sql中使用二级索引时，Extra为：Using Index 3.sql中有join语句多表关联时：Extra为：Using join buffer(Block Nested Loop) 4.sql操作产生临时表时，Extra为：Using temporary 5.sql需要根据某个字段排序，且内存不够时（不管是不是索引）：Extra为：Using filesort

2.2、分析联表SQL的执行计划

SQL如下：

mysql> explain select * from t1 join t2;

SQL执行时，会先将驱动表t1中的数据以全表扫描的方式检索出来放在内存中，一共检索4行。然后在将t2表中的数据检索出来，和t1中的数据join在一起作为返回值。由于我们没有加任何where条件，这里还会存在一个笛卡尔积，也就是说结果中会有16条数据

执行计划解析：

id：每一个select 关键字对应一个id，这条SQL中只有一个select，所以这两行执行计划的id都是1

select_type：均是simple 简单的查询方式。

table：查询了哪张表

Partitions：分区

type：ALL表示全表扫描

possible_keys：可能使用到的索引，null表示，没有任何索引 key：null表示实际上也没有使用到索引

key_len：最长的索引的长度

ref：当你使用到索引时，索引列是等值匹配还是其他的连接方式，由于我们都没有索引，所以直接为null

rows：估算的扫描行数

filterd：过滤的比例，实际数量*过滤比例 ≈ 本次查询返回的行数

Extra：其他的信息

2.3、分析子查询SQL的执行计划

SQL如下：

explain select * from t1 where x1 in (select x1 from t2) or x3 = 890;

id：有两个select 语言，所以执行计划的id有两个

table、partitions 不再赘述

select_type：第一行查询语句的查询类型是Primary，主查询。第二条查询SQL的类型是Subquery，自查询。

对于主查询而言，where条件中有or x3 = 123 （x3我们创建了索引）说明他有可用的索引：t1_x3_index 。但是它最终并没有使用这个索引，它使用的全表扫描ALL的查询方式。所以对应的key_len（最长的索引长度为null）。预估全表扫描出9987条数据。

主查询之所以有x3索引却不用，是因为MYSQL认为，使用这个索引和不用索引的层本擦不多。

对于自查询来说，它的查询类型是自查询。它选择使用t2表的x1这个二级索引，最长的索引长度为515byte，预估扫描14948条数据。

2.4、分析union SQL的执行计划

# 联合t1、t2并对union的结果进行去重！
explain select * from t1 union select * from t2;

同样执行计划有有3行

针对t1的查询为主查询，因为sql中没有任何查询条件，所以Extra、possible_key、key都为NULL，并且预计全表扫描9987行数据。

第二行不再赘述。

第三行的查询类型为：Union result，针对表<union1,2>进行操作，Extra中的Using tmporary表明这是一个临时表。也就是说，结果集放到临时表中进行去重。

2.5、分析复杂SQL的执行计划

# 查询x1列重复次数超过1次以上的x1列以及它的重复次数。
explain select * from (select x1,count(*) as cnt from t1 group by x1) as _t1 where cnt > 1;

先看id为2的执行计划，它是针对t1表的查询，并且最终选择索引：t1_x1_index。注意它的select_type是Derived表示派生，意思是它的查询结果是会被物化成一个临时表给外层的sql使用。

再看外层的id为1的SQL，它是类型为primary的主查询，查询的自查询生成的临时表<drived2> 查询的方式是全表扫描。

2.6、常见的执行计划的type

2.6.1、const

查询聚簇索引

explain select * from t1 where id = 5000;

查询唯一的二级索引，执行计划的type同样是const

# t3.x1 是unique key
explain select * from t3 where x1 = 'qweqwe';

2.6.2、ref

ref 对非唯一的二级索引进行检索

mysql> explain select * from t1 where x1 = 'ucshiuhdaiusd';

多个二级索引的等值匹配的type也是ref

mysql> explain select * from t1 where x1 = 'ucshiuhdaiusd' and x3 = 'qdasdsadas';

使用普通索引的做join操作，被join的表的查询type也是ref

mysql> explain select * from t1 inner join t2 on t1.x1 = t2.x1;

2.6.3、eq_ref

eq_ref 使用主键进行join，被join的表的查询type为eq_ref

mysql> explain select * from t1 inner join t2 on t1.id = t2.id;

2.6.4、eq_or_null

对普通二级索引进行检索，并且二级索引允许存在null的情况，那么查询计划的type为eq_or_null

mysql> explain select * from t1 where x1 = 'ucshiuhdaiusd' or x1 is null;

2.6.5、range

基于二级索引进行对一个范围进行检索，查询类型为：range

mysql> explain select * from t1 where id > 5000;

2.6.6、index

type 为 index 类型的执行计划

# t3表中有3个索引，如下：
# id:聚簇索引
# x1:唯一的二级索引
# x1_x3_x2:联合索引
explain select * from t3 where  x2 = 'fdc1a9f7d94ece2b68b7d3e3be1b0f3b';

可以看到，x2列没有单独的索引。但是sql的执行计划选择去联合索引树中扫全表，也不会去聚簇索引中全表扫描

2.7、详解ref列

Case1 ref之: 库名.表名.列名

explain select * from t1 inner join t2 on t1.id = t2.id;

当执行第二个查询计划时，对主键ID进行等值匹配，而且是使用test.t1.id 来和ID进行等值匹配（而不是某个常量）

Case2 ref之:const

explain select * from t1 where x1 = 'qwdasdas';

2.8、Extra 列

关于这一列上面其实提到过了

1、Using where

explain select * from t1 where x1 = 'ucshiuhdaiusd' and x3 = 'qdasdsadas';

2、Using Index

explain select  x1  from t1;

3、Using filesort ,其中的x1是二级索引，x2是普通索引。

4、Using temporary，表示：使用了中间表

Notice，当你的sql中针对非索引的列进行 group by、distinct、union操作时，它都会通过一张中间表去完成指定操作。而如果对索引列进行group by、distinct、union时，会直接使用索引完成我们的操作。

Case1:

# x1是二级索引
mysql> explain select distinct x1  from t1;
# x2是普通列
mysql> explain select distinct x2  from t1;

Case2:

# x1是索引列
mysql> explain select x1,count(*)  from t1 group by x1;
# x2是普通列

explain select x2,count(*)  from t1 group by x2;

三、成本计算

SQL的执行是有成本的，比如读取磁盘的操作远比内存中的操作高的多。而执行计划的作用就是选择一个低成本执行方式去执行我们的SQL。

下面看一种简单的计算SQL执行成本的方式：

tablestatus

通过如上面的命令可以得到mysql替我们维护的表的统计数据。

其中的rows并不准确，为估算值。data_length/1024/16 为数据页的数量。

全表扫描的成本计算方法如下：

SQL的执行成本约为数据页的数量*1.0 + 数据行数*0.2

四、MySQL会改写你的SQL

如果MYSQL认为你的SQL写的不是很好，它会改写优化你的SQL，目的是为了更好的分析得到最优执行计划。

Case1： mysql会去除sql中多余的括号

Case2：常量替换，如果 `where i=5 and jCase3：对于如下SQL：

select * from t1 join t2 where t1.x1 = t2.x2 and t1.id = 1

比如t1表中有id、x1、x2、x3四列

MySQL的可能按照如下的顺序执行

1.反正t1表中就有1行数据符合预期，那先执行如下SQL，将数据查询出来
select * from t1 where id = 1;

比如查询结果如下
id    x1    x2    x3
1        2        3        4

2.使用第一步中查询出来的值，当做常量替换、改写原始sql
select 1,2,3,4,t2.* from t1 join t2 where t2.x2 = 2;

Case4: 如下SQL：

select * from t1 where x1 = (select x1 from t2 where id = xxx);

MySQL执行该SQL时，首先会执行子查询语句，先根据id找到一条数据，取出其x1的值，作为外层sql的常量。然后再执行外层SQL

Case5: ```bash select * from t1 where x1 = (select x1 from t2 where t2.x2 = t1.x2); ```

子查询中的条件又依赖t1表的x2列的值，所以想执行该SQL，就得先遍历t1表，将每一行t1中的x2的值放入到子查询中作为条件，得到子查询的x1后再当做常量作为外层查询的条件。

Case6: 对in语句的优化，如下SQL：

select * from t1 where x1 in (select x1 from t1 where x2 = xxx);

假设t1、t2中各有10万条数据。

MySQL可能会将SQL的执行流程优化成下面这样：

Step1：先执行子查询语句，假设我们从10w条数据中过滤出500条。

Step2：基于memory存储引擎，再内存中，将过滤出的500条数据写入临时表，也叫做物化表，并为他建立索引。如果数据很多内存不够用，也可能以普通B+Tree的方式将其放在磁盘中。

Step3：遍历这个临时表，并将遍历出的x1的值作为条件放在外层sql中，这样就避免了遍历外层sql时需要的10万次遍历了！

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

11-20 19:57

已编辑

求校招Offer比较：某大厂VS某中厂

某大厂 golang工程师 23.0k*16.0, 2k房补，年终大概率能拿到

点赞评论收藏

昨天 00:11

已编辑

广东工业大学算法工程师

裁应届

避雷深圳  yidao，试用期 6 个月。好嘛，试用期还没结束，就直接告诉你尽快找下一家吧，我谢谢您嘞

牛客75408465号：笑死，直属领导和 hr 口径都没统一，各自说了一些离谱的被裁理由，你们能不能认真一点呀，哈哈哈哈哈😅😅😅

点赞评论收藏

10-11 16:32

早稲田大学人工智能

今日首绷-代写

不是哥们儿

小火柴燃烧吧：接啊，接了之后反手在咸鱼找个大学生搞一下，量大从优

点赞评论收藏

10-25 00:32

这种简历应该怎么投秋招，摆了四年基本属于啥都不会，救救

香梨想要offer：感觉考研以后好好学后面能乱杀，目前这简历有点难

点赞评论收藏

11-22 19:21

上海交通大学产品经理

Offer篇主管人nice，但我劝她据offer

学妹找我聊，她实习的大厂J终于给她转正offer，非常开心哈：部门氛围好，同事关系好，关键是主管人nice，加班有但是还能接受，真想留下来踏踏实实干几年。幸福的烦恼在于，在没有得到转正offer时候，学妹也投了其他大厂的岗位，结果最近另外一个大厂H也发了offer，薪水不错，岗位不错，现在她有些纠结了。聊完后，我劝她据了J的offer，原因听我细说哈。1，关于发展人的发展离不开时代的烙印：在对的时间选择有潜力的赛道（行业）和赛车（公司），最好能在核心部门核心岗位，努力拼搏，锻炼能力，积累经验，跟着团队，公司和行业一起成长，未来的路会越走越宽。她不喜欢大城市的生活方式，未来还是想回到出生的城市有...

毕业求职不EMO 牛客创作赏金赛

点赞评论收藏

点赞收藏评论

全站热榜

正在热议

# 选完offer后，你后悔学本专业吗 #

# 机械人，你在招聘流程中的企业有哪些？ #