博客访问： 2973195
博文数量： 199
博客积分： 1400
博客等级：上尉
技术积分： 4126
用户组：普通用户
注册时间： 2008-07-06 19:06

个人简介

半个PostgreSQL DBA，热衷于数据库相关的技术。我的ppt分享https://pan.baidu.com/s/1eRQsdAa https://github.com/chenhuajun https://chenhuajun.github.io

文章分类

全部博文（199）

其他（1）
citus（10）
greenlpum（1）
安全（1）
Pacemaker（3）
MySQL（21）
Symfoware（2）

Native（1）
分布式（0）
C（1）
Solaris（1）
Linux（11）
C#（3）
故障案例（5）
NoSQL（4）
云计算（1）
Windows（3）
Database（13）
PostgreSQL（101）

安装配置（1）

HA（3）

doc（6）

Npgsql（1）

psqlODBC（2）
嵌入式开发（8）
Java开发（2）
生活随笔（3）
未分配的博文（4）

文章存档

2020年（5）

2019年（1）

2018年（12）

2017年（23）

2016年（43）

2015年（51）

2014年（27）

2013年（21）

2011年（1）

2010年（4）

2009年（5）

2008年（6）

我的朋友

PostgreSQL的表膨胀及对策

PostgreSQL的MVCC机制在数据更新时会产生dead元组，这些dead元组通过后台的autovacuum进程清理。一般情况下autovacuum可以工作的不错，但以下情况下，dead元组可能会不断堆积，形成表膨胀(包括索引膨胀)。

autovacuum清理速度赶不上dead元组产生速度
由于以下因素导致dead元组无法被回收
- 主库或备库存在长事务
- 主库或备库存在未处理的未决事务
- 主库或备库存在断开的复制槽

检查表膨胀

方法1：查询pg_stat_all_tables系统表

SELECT
    schemaname||'.'||relname,
    n_dead_tup,
    n_live_tup,
    round(n_dead_tup * 100 / (n_live_tup + n_dead_tup),2) AS dead_tup_ratio
FROM
    pg_stat_all_tables
WHERE
    n_dead_tup >= 10000
ORDER BY dead_tup_ratio DESC
LIMIT 10;

方法2:使用pg_bloat_check工具

`pg_bloat_check`会进行全表扫描，比`pg_stat_all_tables`准确，但比较慢对系统性能冲击也较大，不建议作为常规工具使用。

以上方法包含了对索引膨胀的检查。但需要注意的是，表中不能被回收的dead tuple在索引页里是作为正常tuple而不是dead tuple记录的。考虑到这一点，索引的实际膨胀要乘以对应表的膨胀率。

预防表膨胀

调整autovacuum相关参数，加快垃圾回收速度

对于写入频繁的系统，默认的autovacuum_vacuum_cost_limit参数值可能过小，尤其在SSD机器上，可以适当调大。
```
autovacuum_vacuum_cost_limit = 4000 
```
监视并处理以下可能导致dead元组无法被回收的状况
- 长事务
- 未决事务
- 断开的复制槽
强制回收

设置old_snapshot_threshold参数，强制删除为过老的事务快照保留的dead元组。这会导致长事务读取已被删除tuple时出错。
```
old_snapshot_threshold = 12h 
```
old_snapshot_threshold不会影响更新事务和隔离级别为RR只读事务。old_snapshot_threshold参数也不能在线修改，如果已经设置了old_snapshot_threshold但又需要运行更长的RR只读事务或单个大的只读SQL，可以临时在备机上设置max_standby_streaming_delay = -1，然后在备机执行长事务(会带来主备延迟)。

杀死长事务

设置可以部分避免长事务的参数

idle_in_transaction_session_timeout = 60s
lock_timeout = 70s

参考

阅读(4390) | 评论(0) | 转发(0) |

上一篇：如何遏制PostgreSQL WAL的疯狂增长

下一篇：PostgreSQL如何保障数据的一致性

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6

PostgreSQL的表膨胀及对策

检查表膨胀

预防表膨胀

相关代码

参考