InnoDB 数据表压缩原理与限制 -zzjlzx-ChinaUnix博客

zzjlzxzzjlzx.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zzjlzx

博客访问： 10649495
博文数量： 1669
博客积分： 16831
博客等级：上将
技术积分： 12594
用户组：普通用户
注册时间： 2011-02-25 07:23

个人简介

柔中带刚，刚中带柔，淫荡中富含柔和，刚猛中荡漾风骚，无坚不摧，无孔不入！

文章分类

全部博文（1669）

NGINX（1）
MongoDB（2）
docker（8）
shadowsocks（1）
CloudFoundry（11）
CloudStack（102）
openstack（61）
PHP（0）
mail（0）
hadoop（25）
GemFire（1）
文件系统（4）
CDN（7）
下载及资源（15）
数据缓存（8）
web 加速（9）
分布式文件系统架（23）
虚拟化（133）
同步（6）
网站架构（50）
windows 监控（15）
mysql 监控（5）
oracle 监控（2）
linux 监控（24）
web 监控（35）
其他数据库（27）
备份恢复（28）
VPN及认证（24）
云系统（29）
windows（29）
WEB 故障（13）
mysql 备份（10）
oracle 集群（15）
HA及负载均衡（52）
存储（66）
shell（39）
web 应用（19）
mysql 优化（16）
mysql 故障（14）
mysql 安全（8）
mysql 配置（29）
mysql 应用（10）
web 安全（21）
SAN交换路由（26）
web 优化（46）
基础解释（24）
linux 安全（37）
linux 故障（22）
linux 应用（85）
linux 配置（64）
web 配置（23）
oracle 备份（33）
UNIX（12）
Solaris（5）
Aix（1）
oracle 配置（69）
oracle 优化（62）
oracle 安全（10）
oracle 应用（30）
交流（29）
oracle 故障（59）
linux 优化（31）
未分配的博文（4）

文章存档

2023年（4）

2022年（1）

2021年（10）

2020年（24）

2019年（4）

2018年（19）

2017年（66）

2016年（60）

2015年（49）

2014年（201）

2013年（221）

2012年（638）

2011年（372）

我的朋友

相关博文

InnoDB 数据表压缩原理与限制

分类： Mysql/postgreSQL

2013-03-18 10:01:10

InnoDB 数据表压缩原理与限制 2013-03-15 11:31:46

分类： Mysql/postgreSQL

压缩理念：通过提高CPU利用率和节约成本，降低数据库容量及I/O负载，从而使数据吞吐率得到显著提高。

压缩原理：压缩表减少了磁盘上数据库的大小，使得用户不必频繁地操作写入和读取便可以访问数据。对于 InnoDB的工作量以及传统的用户表而言（特别是在某些读取密集型的应用中，内存有足够的空间存储常用数据），数据压缩不仅大大减少了数据库所需的存储空间，而且还减少了 I/O的工作量，提高了数据吞吐率，从而节约开销处理成本。节省存储成本固然重要，但是减少 I/O成本更为关键。

压缩限制：为了保持数据库文件的向下兼容性，只有在使用innodb_file_format配置参数来启动“Barracuda”数据库文件格式时，压缩才能被指定。在 InnoDB系统表空间压缩表也是不可行的。系统表空间（space 0, the ibdata* 文件）不仅包含用户数据，还包含InnoDB内部系统信息，永远不能被压缩。因此，压缩只适用于存储在表空间的表（以及索引）。

什么时候使用压缩：通常情况下，对于字符串数量适中的表来说，读取数据比写入数据速度更快，压缩性能最佳。压缩时应努力减少数据文件的大小，影响其压缩效率的决定性因素就是数据本身。在一组数据中识别重复的字符串可以撤消压缩。完全随机的数据是最糟糕的。传统的数据往往有重复的值，压缩起来也相对有效。字符串也往往很容易压缩，不管它是定义在CHAR, VARCHAR, TEXT上还是BLOB列上。另一方面，某些表包含了大部分的二进制数据（整数或浮点数）或者之前被压缩的数据（例如JPEG或PNG图像），压缩起来通常比较困难。

除了考虑选择哪些表进行压缩（以及页面大小如何设置），工作量是衡量性能的另一个关键因素。InnoDB为压缩的数据设置了修改日志，如果应用程序以读取为主而不是以更新为主，那么，在索引页占用完每一页“修改日志”的空间之后，只有少数的页面需要进行重组和重新压缩。如果更新主要改变的是非索引列或者一些包含了碰巧被存储为“off-page”的BLOBs及大的字符串的列，压缩的开销是可以接受的。如果表中唯一更改的是使用单递增主键的INSERTs语句，并且不存过太多非聚集索引，那么，便没必要重组或重新压缩索引页。由于InnoDB能够在压缩页面“标记删除”以及删除记录，并以此来“替代”修改未压缩的数据，因此，在表中进行DELETE操作是相对有效的。

对于某些环境，加载数据所耗费的时间与运行检索所需的时间同样意义重大。特别是在数据仓库环境下，很多表的属性为只读或者以读取为主。在这种情况下，除非在更少的磁盘读取中或存储成本上造成的节约效果是显著的，否则，从增加的加载时间角度出发，压缩付出的代价实在不能令人接受。

从根本上说，当CPU时间可用于压缩及解压数据时，压缩效果最佳。因此，如果工作量是由I/O引起的，而不是由CPU引起，压缩便能够提高整体性能。所以，在使用不同的压缩配置测试应用程序时，你应该在一个类似于产品系统计划配置的平台上进行测试。

阅读(1412) | 评论(0) | 转发(0) |

上一篇：新做的mysql5.1中文手册

下一篇：MYSQL四个timeout参数的含义

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6