Mysql

关注公众号 jb51net

关闭
首页 > 数据库 > Mysql > mysql 联合索引

MySQL 联合索引实战示例

作者:辰风沐阳

文章讲解了MySQL联合索引的原理、使用场景和优化策略,通过实际项目案例分析了如何根据业务需求合理设计索引,优化查询性能,最后解释了覆盖索引的概念及其在查询中的优势,强调了索引设计的重要性,感兴趣的朋友跟随小编一起看看吧

1. 联合索引

MySQL 联合索引(也称复合索引)是在表的多个列上共同创建的一个索引,能极大的优化多条件查询的性能

它并非多个单列索引的简单叠加,而是一个将多列值组合在一起,并按照特定顺序进行排序和存储的 B+ 树结构

假设创建了一个联合索引 (A, B, C),联合索引设计速查表:

查询语句索引使用情况原因分析
A = 1 AND B = 2 AND C = 3全用完美匹配,效率最高
A = 1 AND B = 2A, B 有效符合最左前缀原则
A = 1A 有效符合最左前缀原则
B = 2 AND C = 3失效缺少最左列 A,索引无法使用
A = 1 AND C = 3仅 A 有效跳过了中间列 B, C 无法使用索引
A = 1 AND B > 10 AND C = 3A,B 有效B 是范围查询,导致 C 失效(范围列右侧失效)
A = 1 ORDER BY BA,B 有效索引可用于排序优化

2. 最左侧原则

最左侧原则:在使用联合索引时,查询条件必须从索引的最左边一列开始匹配,并且匹配过程不能跳过中间的列

这是理解和使用联合索引的基石,联合索引(a,b,c)的底层 B+ 树是按照(a,b,c)的顺序进行排序的,所以必须遵循该原则

接下来,我们通过一个案例来理解最左侧原则,运行以下命令创建一个测试表:

CREATE TABLE `users` (
  `id` int(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '主键',
  `name` varchar(30) DEFAULT NULL COMMENT '姓名',
  `age` tinyint(4) DEFAULT NULL COMMENT '年龄',
  `gender` char(1) DEFAULT NULL COMMENT '性别',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='用户表';
INSERT INTO `users` (`name`, `age`, `gender`) VALUES ('liang', 18, '男');
INSERT INTO `users` (`name`, `age`, `gender`) VALUES ('zhang', 20, '女');
INSERT INTO `users` (`name`, `age`, `gender`) VALUES ('chen', 25, '男');
INSERT INTO `users` (`name`, `age`, `gender`) VALUES ('sun', 30, '女');

运行以下命令分析 SQL 语句,可以发现是全表扫描数据

explain select * from users where name = 'liang' and age = 18 and gender = '男';

我们准备使用联合索引来优化这个 SQL,创建联合索引语法格式:

create index index_name on table_name (column1, column2, ...);

所以,我们可以运行以下命令创建联合索引:

-- 相当于构建了一个按照 name > age > gender 顺序排序的数据结构
create index idx_name_age_gender on users (name, age, gender);

联合索引创建之后,那么它在什么时候有效呢 ?需要认真思考一下这个问题

有效查询:

无效或部分失效查询:

-- 联合索引有效
explain select * from users where name = 'liang';
explain select * from users where name = 'liang' and age = 18;
explain select * from users where name = 'liang' and age = 18 and gender = '男';
-- 联合索引无效
explain select * from users where age = 18;
-- 仅 name 生效,gender 失效
explain select * from users where name = 'liang' and gender = '男';

底层原理:为什么要遵守这个原则 ?理解这个原则的关键在于理解 B+ 树的存储结构

联合索引在底层并不简单的三个字段并列,而是层级排序的。(可以把它想象为一本电话簿或字典)

为什么跳过 a 就不行 ?

为什么跳过 bc 就不行 ?

3. 范围查询打断

前面我们说的都是等值查询,但如果是范围查询和模糊查询呢 ?这两个场景容易踩坑,也是面试和实战中的高频考点

范围查询打断(范围查询后面的列索引失效):

为什么会这样 ?(底层原理)

这是因为联合索引的 B+ 树是按照从左到右的顺序构建的:

当你使用 a = 1 and b > 10 时:

数据库找到了 a = 1 的数据块,然后在这个块里找 b > 10 的数据。因为 b 是范围查找,它匹配到了多个 b 的值

在这些不同的 b 值下,c 列的数据是杂乱无章的(因为 c 只有在 b 固定时才有序),既然 c 是乱序的,索引树就无法利用二分查找来定位 c,只能遍历扫描

实战案例演示,假设联合索引为 idx(a, b, c)

查询语句索引使用情况解释说明
where a = 1 and b > 10 and c > 2a,b 有效,c 失效b 使用了范围,导致后面的 c 无法使用索引定位
where a = 1 and b = 2 and c > 5a,b,c 全有效范围查询在最后一列,前面都是等值,所以都能用到
where a > 1 and b = 2 and c = 3a 有效 b,c 失效a 使用了范围,直接导致后面的 b,c 失效
where a = 1 and c > 5a 生效 c 失效虽然 c 使用了范围,因为跳过了中间 b,所以 c 失效

注:通常我们将等值查询的列放在前面,范围查询的列放在最后,这样能最大化利用索引

4. 模糊查询(like)

核心规则:模糊查询是否走索引,完全取决于通配符 % 的位置

假设索引为 idx(name) 或联合索引的最左列:

模糊查询类型SQL 示例索引情况原理分析
前缀匹配like "abc%"生效索引树是按照字符顺序排的,
abc 开头的字符串在树中是连续存储的,
数据库可以快速定位 abc 的起始位置并扫描
后缀匹配like "%abc"失效abc 结尾的字符串在索引树中是分散的,
无法通过索引定位,只能全表扫描
包含匹配like "%abc%"失效同上,数据在索引中无序,无法利用索引

联合索引中的模糊查询行为遵循 “最左前缀原则” 和 “范围打断原则” 的混合逻辑

场景 A:前缀匹配(视为等值)

场景 B:后缀/包含匹配(视为全表扫描)

场景 C:前缀匹配作为范围(打断后续)

为了方便记忆,可以参考这张表:

场景关键特征索引是否生效建议
范围查询><between当前列生效,后续列失效将范围查询的列尽量放在索引的最后一列
前缀匹配LIKE 'abc%'生效尽量使用前缀匹配
后缀/包含匹配LIKE '%abc'失效如果必须后缀/包含匹配,考虑用全文索引或搜索引擎(Elasticsearch)

5. 实际项目示例

假设正在开发一个电商后台,有一张订单表 orders,数据量很大(百万级)

CREATE TABLE `orders` (
  `id` bigint(20) NOT NULL AUTO_INCREMENT COMMENT '主键ID',
  `order_no` varchar(64) NOT NULL COMMENT '订单编号',
  `user_id` bigint(20) NOT NULL COMMENT '用户ID',
  `merchant_id` bigint(20) NOT NULL COMMENT '商家ID',
  `status` varchar(20) NOT NULL COMMENT '订单状态:UNPAID, PAID, SHIPPED, FINISHED',
  `amount` decimal(10,2) NOT NULL DEFAULT '0.00' COMMENT '订单金额',
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '创建时间',
  PRIMARY KEY (`id`),
  UNIQUE KEY `uk_order_no` (`order_no`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COMMENT='电商订单表';

创建一个存储过程,用于生成测试数据

DELIMITER $$
CREATE PROCEDURE batch_insert_orders()
BEGIN
  DECLARE i INT DEFAULT 1;
  DECLARE v_user_id BIGINT;
  DECLARE v_merchant_id BIGINT;
  DECLARE v_status VARCHAR(20);
  -- 开启事务,提高插入速度
  START TRANSACTION;
  WHILE i <= 10000 DO
    -- 随机生成用户ID (800-999)
    SET v_user_id = FLOOR(800 + RAND() * 200);
    -- 随机生成商家ID (1001-1005)
    SET v_merchant_id = FLOOR(1001 + RAND() * 5);
    -- 随机状态
    SET v_status = ELT(FLOOR(1 + RAND() * 4), 'UNPAID', 'PAID', 'SHIPPED', 'FINISHED');
    INSERT INTO `orders` (`order_no`, `user_id`, `merchant_id`, `status`, `amount`, `create_time`)
    VALUES (
      CONCAT('ORD_', DATE_FORMAT(NOW(), '%Y%m%d'), '_', LPAD(i, 6, '0')),
      v_user_id,
      v_merchant_id,
      v_status,
      ROUND(RAND() * 1000, 2),
      DATE_ADD(NOW(), INTERVAL -FLOOR(RAND() * 30) DAY) -- 随机过去30天内的时间
    );
    SET i = i + 1;
  END WHILE;
  COMMIT;
END$$
DELIMITER ;
-- 调用存储过程执行插入
CALL batch_insert_orders();

场景一:后台订单列表查询(最典型)

业务需求:运营人员经常在后台查询 某个商家特定日期范围内待发货 订单

-- 当前我们还没有加索引,现在查询是全表扫描
SELECT * FROM orders
	WHERE merchant_id = 1001
	AND status = 'UNPAID'
	AND create_time > '2023-10-01';

索引设计策略:我们需要建立联合索引 (merchant_id, status, create_time)

-- 创建联合索引之后,再执行上面命令分析 SQL 语句可以看到联合索引已被使用
create index idx_merchant_status_time on orders (merchant_id, status, create_time);

场景二:用户订单列表查询(排序优化)

业务需求:C 端用户查看 “我的订单”,通常按时间倒序排列

SELECT * FROM orders WHERE user_id = 888 ORDER BY create_time DESC LIMIT 20;

索引设计策略:建立联合索引 (user_id, create_time)

create index idx_user_time on orders (user_id, create_time);

场景三:覆盖索引(无需回表,极致性能)

业务需求:在订单列表页,只需要展示 “订单号” 和 “当前状态”,不需要展示收获地址等大字段的详情

SELECT order_no, status FROM orders WHERE user_id = 888 AND create_time > '2023-01-01';

索引设计策略:建立联合索引 (user_id, create_time, order_no, status)

create index idx_uid_time_no_status on orders (user_id, create_time, order_no, status);

6. 覆盖索引的理解

在场景三中使用了覆盖索引,你可能不太理解什么是覆盖索引,我们来研究一下这个问题

首先,需要先了解一下数据库中的原理,在 MySQL 的 InnoDB 引擎里:

执行查询时,如果使用二级索引,通常会发生两件事:

“回表” 是一次额外的、昂贵的 I/O 操作,而覆盖索引的精髓就在于:

结合 orders 表来理解,回到场景三,建立的索引是:(user_id, create_time, order_no, status)

SELECT order_no, status FROM orders WHERE user_id = 888 AND create_time > '2023-01-01';

为什么这个索引是覆盖索引 ?先来拆解一下

执行过程(使用覆盖索引):

对比一下,如果不用覆盖索引会怎么样 ?

假设我们的索引只是 (user_id, create_time),那么执行过程需要回表:

总结:覆盖索引不是一种特殊的索引类型,而是一种高效的查询状态

到此这篇关于MySQL 联合索引的文章就介绍到这了,更多相关mysql 联合索引内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

您可能感兴趣的文章:
阅读全文