半个PostgreSQL DBA,热衷于数据库相关的技术。我的ppt分享https://pan.baidu.com/s/1eRQsdAa https://github.com/chenhuajun https://chenhuajun.github.io
分类: Mysql/postgreSQL
2017-08-15 21:02:10
PostgreSQL的MVCC机制在数据更新时会产生dead元组,这些dead元组通过后台的autovacuum进程清理。一般情况下autovacuum可以工作的不错,但以下情况下,dead元组可能会不断堆积,形成表膨胀(包括索引膨胀)。
方法1:查询pg_stat_all_tables系统表
SELECT schemaname||'.'||relname, n_dead_tup, n_live_tup, round(n_dead_tup * 100 / (n_live_tup + n_dead_tup),2) AS dead_tup_ratio FROM pg_stat_all_tables WHERE n_dead_tup >= 10000 ORDER BY dead_tup_ratio DESC LIMIT 10;
方法2:使用pg_bloat_check工具
`pg_bloat_check`会进行全表扫描,比`pg_stat_all_tables`准确,但比较慢对系统性能冲击也较大,不建议作为常规工具使用。
以上方法包含了对索引膨胀的检查。但需要注意的是,表中不能被回收的dead tuple在索引页里是作为正常tuple而不是dead tuple记录的。考虑到这一点,索引的实际膨胀要乘以对应表的膨胀率。
调整autovacuum相关参数,加快垃圾回收速度
对于写入频繁的系统,默认的autovacuum_vacuum_cost_limit参数值可能过小,尤其在SSD机器上,可以适当调大。
autovacuum_vacuum_cost_limit = 4000
监视并处理以下可能导致dead元组无法被回收的状况
强制回收
设置old_snapshot_threshold参数,强制删除为过老的事务快照保留的dead元组。这会导致长事务读取已被删除tuple时出错。
old_snapshot_threshold = 12h
old_snapshot_threshold不会影响更新事务和隔离级别为RR只读事务。old_snapshot_threshold参数也不能在线修改,如果已经设置了old_snapshot_threshold但又需要运行更长的RR只读事务或单个大的只读SQL,可以临时在备机上设置max_standby_streaming_delay = -1,然后在备机执行长事务(会带来主备延迟)。
杀死长事务
设置可以部分避免长事务的参数
idle_in_transaction_session_timeout = 60s lock_timeout = 70s
vacuum() ->vacuum_rel() ->vacuum_set_xid_limits() ->GetOldestXmin() 找出以下最小的事务ID,大于该事务ID的事务删除的tuple将不回收 - backend_xid,所有后端进程的当前事务ID的最小值 - backend_xmin,所有后端进程的事务启动时的事务快照中最小事务的最小值 - replication_slot_xmin,所有复制槽中最小的xmin(备库的backend_xid和backend_xmin会在这里反映) - replication_slot_catalog_xmin,所有复制槽中最小的catalog_xmin ->TransactionIdLimitedForOldSnapshots() 如果设置了old_snapshot_threshold,则比backend_xid和old_snapshot_threshold->xmin都老的dead元组也可以被回收
-