Mysql

关注公众号 jb51net

关闭
首页 > 数据库 > Mysql > explain性能详细分析

基于explain性能详细分析

作者:zyjzyjjyzjyz

这篇文章主要介绍了基于explain性能详细分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

先看看sql的执行过程

explain的返回列详解

1、id列

每个select都有一个对应的id号,并且是从1开始自增的。一共由四种情况。

(1)id号相同,从上往下执行。

CREATE table users(
	id int PRIMARY KEY,
	user_id int
)
CREATE table orders(
	id int PRIMARY KEY,
	order_id int
)
 
-- create index inx_users_user on users(user_id);
create index inx_orders_order on orders(order_id);
 
explain 
select users.* from users inner join orders on users.id = orders.id;

id号相同,从上往下执行,先users再orders

(2)id号不同,号大的先执行

EXPLAIN
select id from users where id = (select id from orders where id = 2);

id号不同,号大的先执行,先orders再users

(3)两种情况都有————限制性序号大的,再同级从上往下执行。

set session OPTIMIZER_switch='derived_merge=off';#关闭5.7对衍生表合并优化
EXPLAIN
select * from (select users.id from users where user_id = 1) temp inner join orders on temp.id = orders.id;
set session OPTIMIZER_switch='derived_merge=on';

先 (2)后(1)。先user之后derived2,之后orders

uses产生衍生表,衍生表显示derived2(因为id为2的表产生的衍生表)

(4)有null

explain 
select * from users
UNION
select * from orders;

显示null,最后执行null。表示结果集,并且不需要使用它进行查询。

2、select_type:表示查询语句执行的查询操作类型

(1)simple:简单select、连接查询。不包括union和子查询的select。

explain 
select * from users;
 
explain 
select users.* from users inner join orders on users.id = orders.id;

(2)primary:复杂查询中最外层查询,比如使用union或者union all时,id为1的记录select_type通常时primary 

如union语句1——(4):

explain 
select * from users
UNION
select * from orders;

先执行的orders被标记为union,users就是最外层的被标记为primary。

再如子查询1——(3):

set session OPTIMIZER_switch='derived_merge=off';
EXPLAIN
select * from (select users.id from users where user_id = 1) temp inner join orders on temp.id = orders.id;
set session OPTIMIZER_switch='derived_merge=on';

为什么有两个primary,先用users衍生表derived2。外层只是用了连接查询,所以外层的两个连接表都是primary。

(3)subquery:指在select语句中出现的子查询(不在from语句中),并且结果不依赖外部查询(不相关子查询)

EXPLAIN
select id from users where id = (select id from orders where id = 2);

为什么强调不在from语句中呢?

(4)dependent subquery:指在select语句中出现的查询语句(不在from语句中),相关子查询

EXPLAIN
select id from users where id = (select orders.id from orders where users.id = orders.id and id = 3);

不在from语句中的相关子查询,类型就是dependent subquery。

(5)derived:派生表,在from子句的查询语句,表示从为外部数据源中推导出来的,而不是从select语句中的其他列中选择出来的。 

set session OPTIMIZER_switch='derived_merge=off';
EXPLAIN
select * from (select users.id from users where user_id = 1) temp inner join orders on temp.id = orders.id;
set session OPTIMIZER_switch='derived_merge=on';

(6) union:分为union和union all两种,若第二个select出现在union之后,则被标记为union,如果union被from子句的子查询包含,那么第一个select被标记为derived。union会去重,union all不会去重。

explain 
select * from users
UNION
select * from orders;

3、type列:查询所使用的访问类型

需要知道的效率从高到低:

system    const     eq_ref     ref      range    index     all

一般来说保证range级别,最好能达到ref

(1)system:const类型的一种特使场景,查询的表只有一行记录的情况。并且该表使用的存储引擎的统计数据是精确的

实验发现InnoDB创建表,并且直插入一条数据,但是type类型是all,这是为什么呢?

create table product(
	id int PRIMARY KEY,
	price VARCHAR(10)
)
 
insert into product values(1,'123');
 
explain 
select * from product;

原因: 就如上述概念所说的,表使用的存储引擎的统计数据是精确的才是system。InnoDB的统计数据不是精准的,虽然只有一条数据但是type是all。

Memory存储引擎(Hash索引)的统计数据是精确的,所以当只有一条数据的时候type是system。

在InnoDB中查找只有一行数据的系统表,type类型是system。

explain select * from mysql.proxies_priv;

有多行数据的系统表

(2)const:where条件是基于主键或者唯一索引查看一行,并且连接条件是常量(变量就是不确定的)

EXPLAIN
select * from product where id = 1;

(3)eq_ref:基于主键或者唯一索引连接的两个表,对于每个索引键值,只有一条匹配记录,被驱动表的类型为eq_ref

explain 
select * from users inner join orders on users.id = orders.id;

 正如概念所说,被驱动表orders是eq_ref类型。

问题发现1:驱动表users,类型是all,看rows为8,因为需要users的id列的所有值所以全表扫描,但是如果建辅助索引,类型就变为index(这里index的原因是直接扫描了辅助索引不用回表就可以获取到全部的主键值,这很好理解)。但是这里我产生疑问,index和all的区别到底是什么?

问题发现2:概念所说的主键或者唯一索引连接的两个表,那连接条件是驱动表.主键=被驱动表.唯一索引列,是否还是eq_ref

答:否

explain 
select * from users inner join orders on users.id = orders.order_id;

我们可以这么理解,因为唯一索引可以允许插入多个null,所以这样就违反了概念的只有一条匹配记录。 

(4)ref:基于非唯一索引连接两个表或者通过二级索引与常量进行等值匹配,可能会存在多条记录。

①第一种情况:基于非唯一索引连接的两个表

explain 
select * from users inner join orders on users.id = orders.order_id;

上述order_id的唯一索引被删除了

发现这和上面的问题发现2,都是相同的,被驱动表不管是唯一索引还是非唯一索引类型都是ref(确认过了),这是为什么?我学习的视频和文档都没有给出解释或者说没有发现这个问题,欢迎评论区解答。 

②第二种情况:通过二级索引(非唯一索引)列进行等值匹配

explain 
​​​​​​​select * from orders where order_id = 11;

实验发现order_id如果为非唯一索引的等值查询type就是ref,如果是唯一索引的等职查询就是const。 

 (5)range:扫描部分索引,比如使用索引获取某些范围区间的记录。

explain 
select * from orders where id > 3;
 
explain 
select * from orders where order_id > 11;

有些概念说的是非唯一索引进行扫描部分索引,实验发现唯一索引扫描部分索引也会range。

当id > 1为条件时,系统选择了全表扫描。待解决。。。。。 

(6)index:扫描整个索引就能拿到结果,一般时二级索引,这种查询一般为使用覆盖索引(需优化,缩小数据范围)

(7)all:扫描整个表进行匹配,即扫描聚簇索引树

all和index的区别:

但是index还有一种情况,请看。

explain
​​​​​​​select id from users;

上述用到了主键索引,type类型是index,extra是using index意思是使用到了覆盖索引。

我在这里纠结了很长时间,因为我认为使用二级索引不回表才是覆盖索引。

这里我们可以认为,主键索引是一个特殊的二级索引,没有回表,查找数据就是index覆盖索引。

问题:

explain 
​​​​​​​select * from users inner join orders on users.id = orders.id;

既然上述使用主键索引可以index,为什么驱动表类型不可以是index。可能表连接有些特殊情况,其中的水很深,我学到之后会完善这个问题。 

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

您可能感兴趣的文章:
阅读全文