MySQL中主键的选择与磁盘性能-netwenk-ChinaUnix博客

天枫博客netwenk.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

netwenk

博客访问： 145484
博文数量： 21
博客积分： 709
博客等级：上士
技术积分： 255
用户组：普通用户
注册时间： 2005-04-19 22:23

个人简介

凤飞飞

文章分类

全部博文（21）

AWK（1）
python（3）
Wordpress（2）
Shell（0）
apache（1）
MYSQL（2）
PHP（10）
JS（1）
网络技术（0）
FreeBSD（0）
LINUX（1）
未分配的博文（0）

文章存档

2012年（3）

2011年（17）

2005年（1）

我的朋友

cbc009

相关博文

MySQL中主键的选择与磁盘性能

分类： Mysql/postgreSQL

2011-07-01 14:37:36

偶然看到了“Fotolog: Scaling the World's Largest Photo Blogging Community”，才发现很多数据库的优化其实道理都很简单，至高境界是当你面对问题时，是否真正做出了自己的思考，而不仅仅只是经验主义的惯性使然：

本文案例背景介绍：一个图片网站，每张图片都有很多评论。浏览时会执行：SELECT ... FROM ... WHERE photo_identifier = ... ORDER BY posted ...

在“Old Schema”的解决方案中，一切都显得中规中矩：使用了最常见的自增字段identifier作为主键，同时使用photo_identifier, posted作为索引。

数据按照主键进行排序，当执行查询时，根据索引进行数据对位。不过这里的问题在于，同一个图片的评论数据，在磁盘上会分散到多个数据页之上。这也就意味着在查询这些数据的时候，磁盘要不断的调整数据定位。这是一个不小的IO开销。

在“New Schema”的解决方案中，虽然也使用了自增字段，但是采用的是联合主键photo_identifier, posted,identifier，并把identifier作为索引。同时需要注意的是，表类型使用的是Innodb，并缩减了自增字段的长度，这样，主键的长度会短一些，有助于提升Innodb的性能。

数据按照联合主键进行排序，由于photo_identifier字段是联合主键中的第一个字段，所以对于一张图片而言，它所有的评论都保存在磁盘中相邻的位置上。在这种情况下，当对数据进行定位时，Innodb会进行优化：“Pending read”，所谓Pendingread，指的是当发生一次read的时候，并不一定是直接从文件系统里“物理read”，而只是从缓冲池中“逻辑 read”，Innodb内部的优化机制可以合并多次“逻辑read”为一次“物理read”，从而降低IO消耗，提高磁盘性能。

还有一个问题要考虑，使用photo_identifier, posted,identifier联合主键时，如果对一个“旧图片”（photo_identifier较小的图片）发表评论的时候，数据会记录在比较靠前的数据页上（因为数据在硬盘上保存的物理顺序是按主键排序的），和直接使用identifier自增主键相比，这样会引起一个不小的IO负担，因为自增主键在添加新数据时，新数据始终位于数据文件的结尾。所以，实际应用中，文中所示的方法是否可用，还要从客观情况分析而定，比如说评论主要集中在“新图片”上，则IO问题不大，因为“新图片”的记录位于数据文件靠后的位置上，但是如果评论分布的图片比较随机的话，那么此方法是否适用则需要斟酌，不过也可以变通着来，比如说在主从服务器的结构里，我们可以在主服务器上使用identifier自增主键，在从服务器上使用 photo_identifier,posted, identifier联合主键，这样既保证了写操作的效率，也保证了读操作的效率

转自： ... d21b01b3de0580.html

阅读(1700) | 评论(0) | 转发(0) |

上一篇：重定向简单么？不，它很复杂！

下一篇：LINUX下简单命令

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6