Mysql

关注公众号 jb51net

关闭
首页 > 数据库 > Mysql > MySQL分页查询优化

MySQL分页查询优化的实践指南

作者:·云扬·

在日常业务开发中,分页查询是高频操作,比如列表页数据展示、历史记录查询等,但当数据量达到万级以上时,普通的limit分页往往会出现性能瓶颈,本文基于实际测试场景,详细分析MySQL分页查询优化的实践指南,需要的朋友可以参考下

引言

在日常业务开发中,分页查询是高频操作,比如列表页数据展示、历史记录查询等。但当数据量达到万级以上时,普通的limit分页往往会出现性能瓶颈。本文基于实际测试场景,详细分析MySQL分页查询的执行原理,并针对不同排序场景提供优化方案,附完整测试代码与执行计划对比。

一、测试环境搭建:模拟万级数据量

为了更真实地复现分页查询问题,我们先创建测试表并插入10万条测试数据,确保测试环境的一致性。

1.1 创建测试表

use martin;  -- 切换到目标数据库
drop table if exists t1;  -- 若表已存在则删除

CREATE TABLE `t1` (            
  `id` int NOT NULL auto_increment,  -- 自增主键
  `a` int DEFAULT NULL,              -- 普通字段,用于非主键排序测试
  `b` int DEFAULT NULL,              -- 普通字段
  `create_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP COMMENT '记录创建时间',
  `update_time` datetime NOT NULL DEFAULT CURRENT_TIMESTAMP ON UPDATE CURRENT_TIMESTAMP COMMENT '记录更新时间',
  PRIMARY KEY (`id`),  -- 主键索引
  KEY `idx_a` (`a`),   -- 为字段a创建普通索引,用于非主键排序优化
  KEY `idx_b` (`b`)    -- 为字段b创建普通索引(备用)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4;

1.2 批量插入测试数据

通过存储过程批量插入10万条数据,避免手动插入的繁琐:

drop procedure if exists insert_t1;  -- 若存储过程已存在则删除
delimiter ;;  -- 修改语句结束符,避免与存储过程内的分号冲突
create procedure insert_t1()       
begin
  declare i int;                  
  set i=1;                        
  while(i<=100000)do  -- 插入10万条数据
    insert into t1(a,b) values(i, i);  -- a、b字段值与自增id一致
    set i=i+1;                  
  end while;
end;;
delimiter ;  -- 恢复语句结束符为分号
call insert_t1();  -- 调用存储过程插入数据

二、基础分页查询:问题与执行计划分析

最常见的分页查询方式是使用limit offset, size,但当offset(偏移量)较大时,性能会显著下降。我们以“查询第10001-10010条数据”为例,分析其执行逻辑。

2.1 普通limit分页SQL

-- 查询a、b字段,跳过前10000条,取10条
select a,b from t1 limit 10000,10;

2.2 执行计划分析

通过explain查看SQL执行计划,关键信息如下(对应测试截图结果):

核心问题limit 10000,10会先扫描前10010条数据,再丢弃前10000条,仅返回最后10条,大量数据的“无效扫描”导致性能损耗。

三、优化方案一:基于自增连续主键的分页查询

若分页查询基于自增且连续的主键排序(如按id升序),可通过“主键范围查询”替代limit offset,彻底避免无效数据扫描。

3.1 优化后的SQL

-- 直接查询id在10001-10010之间的数据,无需跳过前10000条
select a,b from t1 where id > 10000 and id <= 10010;

3.2 执行计划对比

再次使用explain分析优化后的SQL,执行计划发生显著变化:

3.3 关键注意事项

此方案的前提是主键必须连续。若主键不连续(如删除过数据),会导致查询结果与普通limit分页不一致,示例如下:

先删除一条数据,破坏主键连续性:

delete from t1 where id=10;  -- 删除id=10的记录

对比两种查询结果:

适用场景:主键自增且无删除操作的表(如日志表、流水表)。

四、优化方案二:基于非主键字段排序的分页查询

若分页查询需要按非主键字段排序(如按a字段升序),直接使用order by + limit会触发filesort(文件排序),性能极差。我们通过“子查询查主键 + 关联查详情”的方式优化。

4.1 普通非主键排序分页的问题

以“按a字段排序,查询第99001-99002条数据”为例,普通SQL如下:

select * from t1 order by a limit 99000,2;

4.2 优化后的SQL

核心思路:先通过子查询仅查询“排序后的主键id”(利用索引避免filesort),再通过主键关联查询完整数据:

-- 子查询:按a排序,取第99001-99002条的id(仅扫描索引,无filesort)
-- 主查询:通过id关联表t1,查询完整数据(主键关联性能极高)
select f.* from t1 f 
inner join (select id from t1 order by a limit 99000,2) g 
on f.id = g.id;

4.3 执行计划优化点

适用场景:所有需要按非主键字段排序的分页查询,尤其适合数据量超过10万级的表。

五、总结:不同场景的分页查询选型

分页场景推荐方案优点注意事项
主键自增且连续、按id排序where id > offset and id <= offset+size无无效扫描,性能最优主键必须连续,无删除操作
非主键字段排序子查询查id + 主键关联查详情避免filesort,减少扫描行数需为排序字段创建索引
主键不连续、按id排序保留普通limit,或结合覆盖索引结果准确,兼容性强可通过“覆盖索引”减少全表扫描范围

通过以上优化方案,可有效解决MySQL分页查询在大数据量下的性能问题,实际项目中需根据业务场景(排序字段、主键连续性)选择合适的方案,并结合索引设计进一步提升性能。

以上就是MySQL分页查询优化的实践指南的详细内容,更多关于MySQL分页查询优化的资料请关注脚本之家其它相关文章!

您可能感兴趣的文章:
阅读全文