前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >PostgreSQL表膨胀终结者

PostgreSQL表膨胀终结者

作者头像
July
发布2021-04-22 15:40:24
1.2K0
发布2021-04-22 15:40:24
举报
文章被收录于专栏:数据库干货铺数据库干货铺

点击上方蓝字关注我

PostgreSQL数据库表在删除数据后磁盘空间未释放,该怎么办? 主流的压缩表工具有哪些?该如何选择?

1、从空间未释放说起

近期生产环境出现一张表占用size已达2T,且会定期删除记录,但是,空间一直未释放,是何原因?

原因就在于vacuum,而vacuum怎么存储,清理数据的可参考官方文档进行查看。https://www.postgresql.org/docs/current/routine-vacuuming.html

出现表一直膨胀,该如何处理?开源社区的魅力就在于很多大神会提供很多工具来解决对应的问题,而本问题则有2种主要的工具:pg_repackpgcompacttable

2. 工具对比

2.1 pg_repack

pg_repack的处理方式是创建一张新表,再将历史数据从原表中拷贝一份到新表。在拷贝过程中为了避免表被锁定,会创建了一个额外的日志表来记录原表的改动,并添加了一个涉及INSERT、UPDATE、DELETE操作的触发器将变更记录同步到日志表。当原始表中的数据全部导入到新表中,索引重建完毕以及日志表的改动全部完成后,pg_repack会用新表替换旧表,并将原旧表Drop掉。此工具过程简单且靠谱,单需要额外的磁盘空间来报错临时创建的中间表。

2.2 pgcompacttable

pgcompacttable利用了PostgreSQL的一个有趣特性:在执行INSERT和UPDATE操作时,会将所有新版本的行移到表最开始的可用空间。此为pgcompacttable工具的关键,因为如果从末端反向开始更新所有行,最终所有可用空间被这些行填充,并将表尾部的空间全部释放以便让定期vacuum进行truncate。这样一来,pgcompacttable通过批量更新和vacuum强制移动,最终整个表被重新整理,达到压缩的效果。此工具对磁盘空间要求低,且性能影响可控。

2.3 对比

为了便于大家选择工具,简单做了一个对比说明供参考。

pg_repack

pgcompacttable

是否需要保证性能

是否移动表/索引

是否有足够空间

压缩速率是否高

小结:因很多场景下磁盘空间有限,因而经常选择使用pgcompacttable较多,下面就记录一下pgcompacttable的安装及使用。

3. pgcompacttable部署及使用实例

3.1 添加pgstattuple

pgcompacttable工具使用过程中需要依赖pgstattuple,因此需先添加pgstattuple。如果是源码安装的postgresql,则源码里包含了postgresql-contrib,因此,进行编译及安装即可。

代码语言:javascript
复制
yum install perl-Time-HiRes perl-DBI perl-DBD-Pg -y
cd contrib/
make
make  install

编译完成后会产生几个文件

lib/pgstattuple.so

share/extension/pgstattuple*

之后在所需要使用的数据库里添加pgstattuple

代码语言:javascript
复制
psql -d testdb

testdb=# create extension if not exists pgstattuple;
CREATE EXTENSION

3.2 部署pgcompacttable

下载依赖及安装包后即可使用

代码语言:javascript
复制
# yum install perl-Time-HiRes perl-DBI perl-DBD-Pg -y
# su - postgres
$ git clone https://github.com/dataegret/pgcompacttable.git

3.3 pgcompacttable使用

pgcompacttable可以对database级别、schema级别、table级别进行压缩

代码语言:javascript
复制
./pgcompacttable -h localhost -U postgres -d testdb
./pgcompacttable -h localhost -U postgres -d testdb  -n public
./pgcompacttable -h localhost -U postgres -d testdb -n public -t test_table1
本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2021-04-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据库干货铺 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文件存储
文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档