前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >PostgreSQL查询当前执行中SQL的执行计划——pg_show_plans

PostgreSQL查询当前执行中SQL的执行计划——pg_show_plans

作者头像
数据和云
发布2021-08-27 16:30:05
2.8K0
发布2021-08-27 16:30:05
举报
文章被收录于专栏:数据和云

执行计划存储

如果同样的SQL要执行很多遍,且每次都是同样的执行计划、每次都发生硬解析,则会消耗大量时间。类似于Oracle存放执行计划的library cache,PG也有一个类似的概念——plan_cache。但实际上,PG提供的是预备语言(preparedstatement),它要求应用给这个语句进行标识后,再通过这个标识请求服务端执行,并且由应用负责回收。

对于无参的预备语句,在第一次执行的时候就会生成执行计划,之后会延用其来完成任务;对于有参的预备语句,最优执行计划会因为变量实际值的不同而不同。因此,在PG里:前5次执行预备语句,每一次都产生新的执行计划,叫做custom plan;第6次再执行时,会生成一个不依赖于参数的执行计划并保存下来,叫做generic plan。之后每执行一个预备语句,也都会产生一个相对应的custom plan。若generic plan比custom plan的平均值小1.1倍,则使用generic plan,否则使用当前产生的对应的custom plan。

  • custom plan是指对于preapre语句,在执行execute的时候,把execute语句中的参数嵌套到语句之后生成的计划。
  • custom plan会根据execute语句中具体的参数生成计划,这种方案的优点是每次都按照具体的参数生成优选计划,执行性能比较好;缺点是每次执行前都需要重新生成计划,存在大量的重复的优化器开销。
  • generic plan是指对于preapre语句生成计划,该计划策略会在执行execute语句的时候把参数bind到plan中,然后执行计划。这种方案的优点是每次执行可以省去重复的优化器开销;缺点是当bind参数字段上数据存在倾斜时该计划可能不是最优的, 部分bind参数场景下执行性能较差。

可以根据pg_prepared_statements视图显示当前会话所有可用的预备语句。

代码语言:javascript
复制
postgres=# \d pg_prepared_statements
                  View "pg_catalog.pg_prepared_statements"
     Column      |           Type           | Collation | Nullable | Default
-----------------+--------------------------+-----------+----------+---------
name            | text                     |           |          |
statement       | text                     |           |          |
prepare_time    | timestamp with time zone |           |          |
parameter_types | regtype[]                |           |          |
from_sql        | boolean                  |           |          |

plan_cache_mode参数可以影响prepare语句选择生成执行计划的策略。

  • auto表示按照默认的方式选择custom plan或 者generic plan
  • force_generic_plan表示强制走generic plan
  • force_custom_plan表示强制走custom plan

此参数只对prepare语句生效,一般用在prepare语句中参数化字段存在比较严重数据倾斜的场景下。

代码语言:javascript
复制

通常情况,我们可以通过explain、explain analyze、explain verbose来获取执行计划。

但是explain查询当前缓存的执行计划,在实际中估算的成本可能是不准确的,因为很可能估算的成本和实际运行的成本不一致。而explain analyze、explain verbose则会实际执行SQL,但在某些场景不会被允许执行。

可以尝试采用开启一个事务后,explain analyze、explain verbose查看执行计划,最后rollback。

pg_show_plans模块

接下来的主题则是一个供PostgreSQL数据库查询正在进行的SQL执行计划的模块——pg_show_plans,它可以动态查找当前正在进行的SQL执行计划。

pg_show_plans是一个显示当前运行的所有SQL语句执行计划的模块。它在plan结束位置,截获并存储当前plan tree,从而使其他会话可以打印存储plan tree。此模块支持从9.5到12的PostgreSQL版本。它会在共享内存上创建一个哈希表,以便临时存储查询计划。哈希表大小不能更改,因此如果哈希表已满,则不会存储计划。

安装及使用介绍

1.进到数据库对应的contrib目录下。

代码语言:javascript
复制
[postgres@t1ysl opt]$ cd  /opt/postgresql-12.1/contrib/

2.获取pg_show_plans扩展包。

代码语言:javascript
复制
[postgres@t1ysl contrib]$ git clone https://github.com/cybertec-postgresql/pg_show_plans.git
Cloning into 'pg_show_plans'...
remote: Enumerating objects: 70, done.
remote: Counting objects: 100% (2/2), done.
remote: Compressing objects: 100% (2/2), done.
remote: Total 70 (delta 0), reused 0 (delta 0), pack-reused 68
Unpacking objects: 100% (70/70), done.

3.编译安装。

代码语言:javascript
复制
[postgres@t1ysl contrib]$ cd pg_show_plans/
[postgres@t1ysl pg_show_plans]$ make
make -C ../../src/backend generated-headers
make[1]: Entering directory `/opt/postgresql-12.1/src/backend'
make -C catalog distprep generated-header-symlinks
make[2]: Entering directory `/opt/postgresql-12.1/src/backend/catalog'
make[2]: Nothing to be done for `distprep'.
make[2]: Nothing to be done for `generated-header-symlinks'.
make[2]: Leaving directory `/opt/postgresql-12.1/src/backend/catalog'
make -C utils distprep generated-header-symlinks
make[2]: Entering directory `/opt/postgresql-12.1/src/backend/utils'
make[2]: Nothing to be done for `distprep'.
make[2]: Nothing to be done for `generated-header-symlinks'.
make[2]: Leaving directory `/opt/postgresql-12.1/src/backend/utils'
make[1]: Leaving directory `/opt/postgresql-12.1/src/backend'
gcc -std=gnu99 -Wall -Wmissing-prototypes -Wpointer-arith -Wdeclaration-after-statement -Werror=vla -Wendif-labels -Wmissing-format-attribute -Wformat-security -fno-strict-aliasing -fwrapv -fexcess-precision=standard -O2 -fPIC -I. -I. -I../../src/include  -D_GNU_SOURCE   -c -o pg_show_plans.o pg_show_plans.c
gcc -std=gnu99 -Wall -Wmissing-prototypes -Wpointer-arith -Wdeclaration-after-statement -Werror=vla -Wendif-labels -Wmissing-format-attribute -Wformat-security -fno-strict-aliasing -fwrapv -fexcess-precision=standard -O2 -fPIC -shared -o pg_show_plans.so pg_show_plans.o -L../../src/port -L../../src/common    -Wl,--as-needed -Wl,-rpath,'/opt/pg12/lib',--enable-new-dtags  
[postgres@t1ysl pg_show_plans]$ make install
make -C ../../src/backend generated-headers
make[1]: Entering directory `/opt/postgresql-12.1/src/backend'
make -C catalog distprep generated-header-symlinks
make[2]: Entering directory `/opt/postgresql-12.1/src/backend/catalog'
make[2]: Nothing to be done for `distprep'.
make[2]: Nothing to be done for `generated-header-symlinks'.
make[2]: Leaving directory `/opt/postgresql-12.1/src/backend/catalog'
make -C utils distprep generated-header-symlinks
make[2]: Entering directory `/opt/postgresql-12.1/src/backend/utils'
make[2]: Nothing to be done for `distprep'.
make[2]: Nothing to be done for `generated-header-symlinks'.
make[2]: Leaving directory `/opt/postgresql-12.1/src/backend/utils'
make[1]: Leaving directory `/opt/postgresql-12.1/src/backend'
/bin/mkdir -p '/opt/pg12/lib/postgresql'
/bin/mkdir -p '/opt/pg12/share/postgresql/extension'
/bin/mkdir -p '/opt/pg12/share/postgresql/extension'
/bin/install -c -m 755  pg_show_plans.so '/opt/pg12/lib/postgresql/pg_show_plans.so'
/bin/install -c -m 644 ./pg_show_plans.control '/opt/pg12/share/postgresql/extension/'
/bin/install -c -m 644 ./pg_show_plans--1.0.sql  '/opt/pg12/share/postgresql/extension/'

4.在postgresql.conf文件的shared_preload_libraries里增加pg_show_plans,并重启数据库生效。

代码语言:javascript
复制
vi postgresql.conf
增加 shared_preload_libraries = 'pg_show_plans'  

[postgres@t1ysl ~]$ pg_ctl restart 
waiting for server to shut down.... done
server stopped
waiting for server to start....2021-07-25 08:52:08.402 CST [2990] LOG:  starting PostgreSQL 12.1 on x86_64-pc-linux-gnu, compiled by gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-44), 64-bit
2021-07-25 08:52:08.402 CST [2990] LOG:  listening on IPv4 address "0.0.0.0", port 6000
2021-07-25 08:52:08.402 CST [2990] LOG:  listening on IPv6 address "::", port 6000
2021-07-25 08:52:08.406 CST [2990] LOG:  listening on Unix socket "/tmp/.s.PGSQL.6000"
2021-07-25 08:52:08.434 CST [2990] LOG:  redirecting log output to logging collector process
2021-07-25 08:52:08.434 CST [2990] HINT:  Future log output will appear in directory "/opt/pg_log6000".
 done
server started

5.创建EXTENSION。

代码语言:javascript
复制
postgres=# CREATE EXTENSION pg_show_plans;  
CREATE EXTENSION

6.通过pg_show_plans表可查看当前正在进行的SQL执行计划。

代码语言:javascript
复制
postgres=# \d pg_show_plans
           View "public.pg_show_plans"
Column |  Type  | Collation | Nullable | Default
--------+--------+-----------+----------+---------
pid    | bigint |           |          |
level  | bigint |           |          |
userid | oid    |           |          |
dbid   | oid    |           |          |
plan   | text   |           |          |

模拟使用场景

1.开启两个session。

  • 一个session执行一条较慢SQL(便于获取到其执行计划)
  • 一个session在SQL执行过程获取其执行计划

2.这里我举例的SQL为对一张346MB的表的全表扫描。

代码语言:javascript
复制
session1:
postgres=# \dt+ t1_ysl
                     List of relations
Schema |  Name  | Type  |  Owner   |  Size  | Description
--------+--------+-------+----------+--------+-------------
public | t1_ysl | table | postgres | 346 MB |
(1 row)

postgres=# select * from t1_ysl ;
   id    
---------
3511203
5877715
7284053
4522491
3815961
6454179
2712063
...

通过pg_show_plans和pg_stat_activity联合查询出当前正在进行的SQL执行计划。

代码语言:javascript
复制
session2:
postgres=# SELECT * FROM pg_show_plans;
pid  | level | userid | dbid  |                                 plan                             
     
------+-------+--------+-------+------------------------------------------------------------------
-----
1812 |     0 |     10 | 13593 | Function Scan on pg_show_plans  (cost=0.00..10.00 rows=1000 width
=56)
1899 |     0 |     10 | 13593 | Seq Scan on t1_ysl  (cost=0.00..144247.77 rows=9999977 width=4)
(2 rows)


postgres=#  SELECT p.pid, p.level, p.plan, a.query FROM pg_show_plans p   
   LEFT JOIN pg_stat_activity a  
   ON p.pid = a.pid AND p.level = 0 ORDER BY p.pid, p.level;
pid  | level |                                              plan                                 
             |                             query                              
------+-------+-----------------------------------------------------------------------------------
-------------+----------------------------------------------------------------
1812 |     0 | Sort  (cost=72.08..74.58 rows=1000 width=80)                                      
            +| SELECT p.pid, p.level, p.plan, a.query FROM pg_show_plans p   +
      |       |   Sort Key: pg_show_plans.pid, pg_show_plans.level                                
            +|    LEFT JOIN pg_stat_activity a                               +
      |       |   ->  Hash Left Join  (cost=2.25..22.25 rows=1000 width=80)                       
            +|    ON p.pid = a.pid AND p.level = 0 ORDER BY p.pid, p.level;
      |       |         Hash Cond: (pg_show_plans.pid = s.pid)                                    
            +|
      |       |         Join Filter: (pg_show_plans.level = 0)                                    
            +|
      |       |         ->  Function Scan on pg_show_plans  (cost=0.00..10.00 rows=1000 width=48)
            +|
      |       |         ->  Hash  (cost=1.00..1.00 rows=100 width=44)                             
            +|
      |       |               ->  Function Scan on pg_stat_get_activity s  (cost=0.00..1.00 rows=1
00 width=44) |
1899 |     0 | Seq Scan on t1_ysl  (cost=0.00..144247.77 rows=9999977 width=4)                   
             | select * from t1_ysl ;
(2 rows)

相关参数

  • pg_show_plans.enable 是否可以显示计划。
  • pg_show_plans.plan_format 它控制查询计划的输出格式。可以选择文本或JSON。默认为文本。
  • pg_show_plans.max_plan_length 它设置查询计划的最大长度。默认值为8192[字节]。此参数必须设置为整数。

墨天轮原文链接:https://www.modb.pro/db/88225(复制链接至浏览器或点击文末阅读原文查看)

关于作者

阎书利,云和恩墨技术顾问,中国DBA联盟成员,PGFans签约作者,拥有PGCM、OBCP、OGCA、阿里云ACA等证书,热衷于在墨天轮、Itpub、PGFans分享技术,曾在墨天轮投稿数据库相关技术文章并获奖,且文章多次在开源软件联盟PostgreSQL分会、PostgreSQL公众号上发表。在公司内部进行过PG数据库技术分享。支持过多家运营商、金融、银行、保险等行业的开源数据库项目,现负责公司mogdb、PG数据库运维方面的技术工作,热衷于运维故障处理、备份恢复、升级迁移、性能优化的学习与分享。

END

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-08-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据和云 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
数据库
云数据库为企业提供了完善的关系型数据库、非关系型数据库、分析型数据库和数据库生态工具。您可以通过产品选择和组合搭建,轻松实现高可靠、高可用性、高性能等数据库需求。云数据库服务也可大幅减少您的运维工作量,更专注于业务发展,让企业一站式享受数据上云及分布式架构的技术红利!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档