分布式多副本一致性问题-zyd

YunNotesydzhang.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zyd_cu

博客访问： 4113041
博文数量： 251
博客积分： 11197
博客等级：上将
技术积分： 6862
用户组：普通用户
注册时间： 2008-12-05 14:41

个人简介

@HUST张友东 work@taobao zyd_com@126.com

文章分类

全部博文（251）

互联网（8）
课程笔记（7）
技术交流（5）
KV存储（8）
搜索引擎（5）
系统管理（14）
网络编程（22）
程序设计（14）
文件系统（15）
C/C++（18）
Linux内核（29）
Linux编程（27）
FUSE专辑（10）
分布式系统（19）
工作杂记（17）
TFS开发（33）
未分配的博文（0）

文章存档

2014年（10）

2013年（20）

2012年（22）

2011年（74）

2010年（98）

2009年（27）

我的朋友

相关博文

分布式多副本一致性问题

分类： LINUX

2011-10-13 22:26:41

典型情况：三个副本构成一个group

1. 强一致性：所有的副本更新成功才返回。

如上图C表示Client，【P、S1、S2】构成一个同步组，P表示Primary node，S1，S2是两个secondary node，强同步模型的工作流程为C向P写数据，P向S1，S2转发，只有3个都写成功，才向C返回成功，否则写失败。这种模型对于append操作很容易实现，如果副本没有全部更新成功，向C返回失败即可，不必重新同步P和两个S的数据；但如果是overwrite，则如果在同步过程中部分成功，还要考虑数据的正确性。

同时，P向S1、S2同步的过程，可以进行优化，借鉴GFS的流水线复制方式（P->S1 &S1->S2），以便充分利用每个node的带宽资源。

2. 最终一致性：在经过一个不一致窗口后，副本最终处于一致的状态。

如上图是一种简单的最终一致性实现模型，通过增加一组U（update）节点来实现。具体做法是，C的每次更新以binlog的方式顺序的追加到Update节点（多台来避免单点），然后Update节点定期（如10ms）的将binlog重放到三个副本上（N1,N2,N3）。三个副本可以同时提供读服务，读到的数据可能不是最新的，这就要求上层业务能容忍或者在上层做一些容错（如上层的业务每次会等待不一致窗口过去后再读取数据）。