MySQL水平SHARDING的两种方法及不足-oracle狂热分子-ChinaUnix博客

东东堂的数据库小屋oracn.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

oracle狂热分子

博客访问： 2803060
博文数量： 389
博客积分： 4177
博客等级：上校
技术积分： 4773
用户组：普通用户
注册时间： 2008-11-16 23:29

文章分类

全部博文（389）

MongoDB（3）
12C新特性（15）
Undo/Redo（8）
ASM（7）
Enqueue/Lock（1）
Block（9）
Index（5）
Buffer Pool（7）
Shared Pool（4）
AMM/ASMM（10）
Optimizer（19）
Latch/Mutex（4）
MySQL（69）
Exadata（6）
Timesten（15）
SHELL/PERL（7）
其他（7）
LINUX（24）
DATA GUARD（14）
性能调整（12）
RAC（21）
GOLDENGATE（8）
备份与恢复（23）
问题处理（10）
EM 12C（2）
OCP（32）
数据库理论（1）
存储（3）
oracle（43）
未分配的博文（0）

推荐博文

相关博文

MySQL水平SHARDING的两种方法及不足

分类： Mysql/postgreSQL

2014-11-12 21:41:35

MySQL水平SHARDING的两种方法及不足

在对mysql数据库进行SHARDING的设计中，基中非常重要的就是选择SHARD KEY和SHARD KEY如何去分布。
选择SHARD KEY的一个基本原则就是能使数据根据业务类型尽量分散在多个SHARDING服务器中.

第一种方法是选定某个栏位作为SHARD KEY,根据SHARD KEY的特点，可以选择基于hash,range和list进行SHARDING.
比如现在有3个SHARDING节点,根据SHARD KEY的值，分别hash在这三个SHARDING节点中.range表示对于
某个SHARD KEY范围内的值会存放到一个SHARDING节点上.以上几种shared分布的式,相信对于了解分区的
朋友来说一定十分的熟悉.例如有个订单表,表结构如下:

create table order_item
(id integer,
uid integer,
amount integer)

alter table order_item add primary key(id);

应用程序生成一个id号，然后再根据id做一个hash操作，比如id为12302，通过hash函数，结果为1,数据在1节点中.

这种SHARD KEY的分布方式有一个很不好的地方就是当需要增加或是减少shared节点的情况很不方
便，需要对以前的所有数据进行重新分布.大数据量的情况下这个过程将会变得非常的耗时.

另一种方法通过通过建立一个字典表，比如建立一个服务器列表，然后应用程序通过随机函数从表中随机选择
SHARDING节点进行处理,比如

shard id ip

1            172.28.10.11
2            172.28.10.12
3            172.28.10.13

由应用程序随机产生1-3的随机数，再决定使用哪个服务器进行处理.这种方式的好处是增加SHARDING节点和删除
SHARDING节点都非常的方便.不足的地方是这种方式没有SHARD KEY，数据完全是随机的处理.但是可以通过在redis或是
memcached进行一些优化，比如跟踪原来打算做SHARD KEY的栏位值是分别存放在哪些节点中。

在之前的例子中，通过在redis或是memcached跟踪id和对应的存放服务器，比如id为12302是存放在2服务器中。当应用程序需要
查询某个id的记录时，先从缓存中查出来该id对应的服务器是第几号就可以了，而不再通过SHARD KEY的规则自己算出哪个SHAREDING
节点,然后再去访问对应的服务器.

阅读(7251) | 评论(0) | 转发(0) |

上一篇：使用HAProxy路由MySQL读请求

下一篇：使用KeepAlived实现HAProxy高可用

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6