PostgreSQL游标与索引选择实例详细介绍

更新时间：2022年09月15日 16:34:32 作者：foucus、

这篇文章主要介绍了PostgreSQL游标与索引选择优化案例，文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值，需要的朋友们下面随着小编来一起学习吧

脚本之家 / 编程助手：解决程序员“几乎”所有问题！
脚本之家官方知识库 → 点击立即使用

之前有写过一个案例，order by limit因为数据分布不均而选择了错误的索引，这是由于优化器没法判断数据的分布关系，默认认为数据分布是均匀的所导致的。

而除了limit，当我们在使用游标时也要注意有可能会出现类似的情况。而往往这类在存储过程中的SQL我们更难发现其选择了错误的执行计划，所以需要注意。

1、建测试表

1 2	`bill=#` `create` `table` `tbl (id` `int, c1` `int, c2` `int, c3` `int, c4` `int);` `CREATE` `TABLE`

登录后复制免费讲解

2、写入一批随机数据，ID从1到1000万。

1 2	`bill=#` `insert` `into` `tbl` `select` `generate_series(1,10000000), random()100, random()100, random()100, random()100;` `INSERT` `0 10000000`

登录后复制免费讲解

3、写入另一批100万条数据，c1,c2 与前面1000万的值不一样。

1 2	`bill=#` `insert` `into` `tbl` `select` `generate_series(10000001,11000000), 200,200,200,200;` `INSERT` `0 1000000`

登录后复制免费讲解

4、创建两个索引，也就是本文需要重点关注的，到底走哪个索引更划算

bill=# create index idx_tbl_1 on tbl(id);  
CREATE INDEX 
bill=# create index idx_tbl_2 on tbl(c1,c2,c3,c4);  
CREATE INDEX 

登录后复制免费讲解

5、收集统计信息

1 2	`bill=# vacuum analyze tbl;` `VACUUM`

登录后复制免费讲解

6、查看下面SQL的执行计划，走了正确的索引

bill=# explain select * from tbl where c1=200 and c2=200 order by id;
                                     QUERY PLAN
-------------------------------------------------------------------------------------
 Sort  (cost=72109.20..72344.16 rows=93984 width=20)
   Sort Key: id
   ->  Bitmap Heap Scan on tbl  (cost=1392.77..60811.81 rows=93984 width=20)
         Recheck Cond: ((c1 = 200) AND (c2 = 200))
         ->  Bitmap Index Scan on idx_tbl_2  (cost=0.00..1369.28 rows=93984 width=0)
               Index Cond: ((c1 = 200) AND (c2 = 200))
(6 rows)

登录后复制免费讲解

7、而当我们在游标中使用该SQL时，会发现执行计划出现了偏差

bill=# begin;
BEGIN
bill=*# explain declare tt cursor for select * from tbl where c1=200 and c2=200 order by id;
                                  QUERY PLAN
-------------------------------------------------------------------------------
 Index Scan using idx_tbl_1 on tbl  (cost=0.43..329277.60 rows=93984 width=20)
   Filter: ((c1 = 200) AND (c2 = 200))
(2 rows)

登录后复制免费讲解

为什么会出现这种情况呢，这其实是因为使用游标的SQL会根据cursor_tuple_fraction参数进行自动优化，而该参数默认是0.1，表示只检索前10%的行进行预估，这就和limit有点异曲同工的味道了。

因为对于这张表，优化器认为数据是均匀分布的，而实际上，数据分布是不均匀的，c1=200 and c2=200的记录在表的末端。当我们在游标中只检索了前10%的行，所以会得到一个错误的执行计划。

具体的细节我们可以在parsenodes.h和planner.c中看到：

当使用cursor或者SPI_PREPARE_CURSOR函数时，会设置CURSOR_OPT_FAST_PLAN标志位，然后就会根据cursor_tuple_fraction参数对SQL进行自动优化，所以对于一些数据分布不均的情况，可能就会

导致选择了错误的执行计划。
    /* Determine what fraction of the plan is likely to be scanned */
    if (cursorOptions & CURSOR_OPT_FAST_PLAN)
    {
        /*
         * We have no real idea how many tuples the user will ultimately FETCH
         * from a cursor, but it is often the case that he doesn't want 'em
         * all, or would prefer a fast-start plan anyway so that he can
         * process some of the tuples sooner.  Use a GUC parameter to decide
         * what fraction to optimize for.
         */
        tuple_fraction = cursor_tuple_fraction;
        /*
         * We document cursor_tuple_fraction as simply being a fraction, which
         * means the edge cases 0 and 1 have to be treated specially here.  We
         * convert 1 to 0 ("all the tuples") and 0 to a very small fraction.
         */
        if (tuple_fraction >= 1.0)
            tuple_fraction = 0.0;
        else if (tuple_fraction <= 0.0)
            tuple_fraction = 1e-10;
    }
    else
    {
        /* Default assumption is we need all the tuples */
        tuple_fraction = 0.0;
    }

登录后复制免费讲解

到此这篇关于PostgreSQL游标与索引选择实例详细介绍的文章就介绍到这了,更多相关PostgreSQL游标与索引选择内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

微信公众号搜索 “ 脚本之家 ” ，选择关注

程序猿的那些事、送书等活动等着你

原文链接：https://blog.csdn.net/weixin_39540651/article/details/126857447

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符，请将相关资料发送至 reterry123@163.com 进行投诉反馈，一经查实，立即处理！

postgresql 替换空格换行和回车的操作
这篇文章主要介绍了postgresql 替换空格换行和回车的操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
Postgresql psql文件执行与批处理多个sql文件操作
这篇文章主要介绍了Postgresql psql文件执行与批处理多个sql文件操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
Postgresql之时间戳long,TimeStamp,Date,String互转方式
这篇文章主要介绍了Postgresql中的时间戳long,TimeStamp,Date,String互转方式，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完全的地方，望不吝赐教
2023-03-03
postgresql的now()与Oracle的sysdate区别说明
这篇文章主要介绍了postgresql的now()与Oracle的sysdate区别说明，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-12-12
PostgreSQL 设置允许访问IP的操作
这篇文章主要介绍了PostgreSQL 设置允许访问IP的操作，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-12-12
PostgreSQL数据库中修改表字段的常用命令小结
这篇文章主要给大家介绍了PostgreSQL数据库中修改表字段的常用命令操作,文中有详细的代码示例供大家参考,具有一定的参考价值,需要的朋友可以参考下
2023-12-12
PostgreSQL中的OID和XID 说明
在PostgreSQL中经常碰到OID和XID，刚才不明白这些东西是干什么的。
2009-09-09
基于PostgreSQL和mysql数据类型对比兼容
这篇文章主要介绍了基于PostgreSQL和mysql数据类型对比兼容，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2020-12-12
PostgreSQL 实现查询表字段信息SQL脚本
这篇文章主要介绍了PostgreSQL 实现查询表字段信息SQL脚本，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
PostgreSQL数据库的基本查询操作
这篇文章采用详细的代码示例为大家介绍了PostgreSQL数据库的基本查询操作使用，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步早日升职加薪
2022-04-04

PostgreSQL游标与索引选择实例详细介绍

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

在线工具

高防CDN

万恒网络

常用在线小工具