Redis源码解析--Persistence-scq2099yt-ChinaUnix博客

施昌权--淘宝卫霍shicq.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

scq2099yt

博客访问： 5862118
博文数量： 291
博客积分： 0
博客等级：民兵
技术积分： 7924
用户组：普通用户
注册时间： 2016-07-06 14:28

个人简介

阿里巴巴是个快乐的青年

文章分类

全部博文（291）

人工智能（16）

基础数学（1）

GPU优化（2）

TensorFlow（3）

机器写作（1）

深度学习（2）

机器学习（2）

机器翻译（1）

NLP算法（1）

NLP工具（1）

NLP科普（1）

AI科普（1）
IT咨询（1）

mac（1）
计算广告学（0）

计算广告学科普（0）

广告过滤（0）

反点击作弊（0）

广告推荐算法（0）

行为习惯广告（0）

广告排序算法（0）

广告匹配算法（0）

广告索引架构（0）
Web技术（10）
大数据（1）

自然语言处理（1）

深度学习（0）

机器学习（0）

社交网络（0）

数据挖掘（0）

个性化推荐（0）
团队建设（5）

产品相关（0）

运维相关（1）

测试相关（3）

敏捷开发（1）
广告技术（12）

移动广告（1）

人群定向技术（1）

广告技术科普（10）

RTB技术（0）
高性能服务器（15）

调试（2）

CPU（2）

调优（2）

监控（2）

内存（3）

并发（1）

锁（0）

IO（3）
网络通讯（4）

HTTP（1）

TCP（3）
集群（3）
移动互联网（6）

Cocos2D-HTML5（0）

Cocos2D-x（0）

Cocos2D（1）

iOS（1）

Android（4）
闲聊杂侃（11）
浏览器（3）

奇淫技巧（1）

Webkit（2）
IM即时通信（5）

OpenFire（0）

Jabber/XMPP（1）

Ejabberd（4）
云计算（0）

KVM/Xen（0）

OpenShift（0）

Cloud Found（0）

OpenStack（0）
分布式（0）

Two-Phase C（0）

MVCC（0）

Lease（0）

Quorum（0）

CAP（0）

Consistent （0）

Gossip（0）

Paxos（0）
Hadoop系列（16）

MapReduce（2）

Hive（0）

Zookeeper（0）

HDFS（3）

Hadoop（9）

HBase（2）
Amazon系列（1）

EC2（0）

AWS（0）

S3（0）

Dynamo（1）
Google系列（1）

GAE（0）

ProtoBuffer（1）

BigTable（0）

Chubby（0）

MapReduce（0）

GFS（0）
架构框架（0）

Node.js（0）

Avro（0）

Shrift（0）
算法与数据结构（27）

字符串（8）

排序（7）

其它（1）

查找（1）

链表（5）

树（5）
编程语言（77）

C++11（1）

JavaScript（1）

JSP（0）

HTML（1）

Java（9）

Shell（15）

Python（11）

Golang（7）

Erlang（6）

PHP（0）

Lua（7）

C++（17）

C（2）
搜索引擎（7）

seo（1）

Nutch（0）

垂直搜索引擎（1）

解密搜索引擎技术（5）

Solr（0）

Sphinx（0）

Lucene（0）
我的开源项目（0）
开源代码解析（69）

Log4cpp（0）

Tomcat（3）

Storm（1）

LevelDB（0）

Apache（1）

fastDFS（0）

HyperTable（0）

Keepalived（1）

LVS（1）

Linux（18）

Varnish（0）

Squid（0）

Heartbeat（0）

Libevent（1）

Nginx（17）

Haproxy（2）

HandleSocket（0）

neo4j（0）

MongoDB（2）

Memcached（3）

Redis（6）

MySQL（4）

RabbitMQ（9）

ZeroMQ（0）
未分配的博文（1）

文章存档

2018年（21）

2017年（4）

2016年（5）

2015年（17）

2014年（68）

2013年（174）

2012年（2）

我的朋友

相关博文

Redis源码解析--Persistence

分类： NOSQL

2013-03-25 18:24:34

      Redis支持两种方式的持久化，分别是定时快照（rdb）和语句追加（aof），下面会详细分析这两种持久化方式。
一、定时快照
1、原理
      定时快照即rdb（snapshotting），Redis内部定时器事件触发时，检查当前数据发生改变的次数与时间是否满足配置文件中指定的持久化条件，如果满足则fork出一个子进程来完成快照任务，而主进程任然提供服务，当有写入操作时由系统以内存页（page）为单位进行copy-on-write。
2、流程
        （1）save命令
      save命令执行一个同步保存操作，将当前Redis实例的所有数据快照以rdb文件的形式保存到磁盘，这个操作会阻塞主线程的工作，通常在生产环境上很少执行save而是执行bgsave来完成快照。收到客户端发送的save命令后，会执行saveCommand（Rdb.c/1160），进而执行rdbSave（Rdb.c/597），rdbSave函数的主脉络如下：
        /* Save the DB on disk. Return REDIS_ERR on error, REDIS_OK on success */
        int rdbSave(char *filename) {
        snprintf(tmpfile,256,"temp-%d.rdb", (int) getpid());
        fp = fopen(tmpfile,"w");
            ...
        rioInitWithFile(&rdb,fp);
            if (rdbWriteRaw(&rdb,magic,9) == -1) goto werr;
          ...
        for (j = 0; j < server.dbnum; j++) {
        di = dictGetSafeIterator(d);
            ...
        /* Write the SELECT DB opcode */
        if (rdbSaveType(&rdb,REDIS_RDB_OPCODE_SELECTDB) == -1) goto werr;
        if (rdbSaveLen(&rdb,j) == -1) goto werr;

          /* Iterate this DB writing every entry */
        while((de = dictNext(di)) != NULL) {
        sds keystr = dictGetKey(de);
          robj key, *o = dictGetVal(de);
        long long expire;

        initStaticStringObject(key,keystr);
        expire = getExpire(db,&key);
          if (rdbSaveKeyValuePair(&rdb,&key,o,expire,now) == -1) goto werr;
        }
        dictReleaseIterator(di);
        }
        ...
        /* EOF opcode */
        if (rdbSaveType(&rdb,REDIS_RDB_OPCODE_EOF) == -1) goto werr;
          ...
        /* Make sure data will not remain on the OS's output buffers */
        fflush(fp);
        fsync(fileno(fp));
        fclose(fp);

        /* Use RENAME to make sure the DB file is changed atomically only
            * if the generate DB file is ok. */
        if (rename(tmpfile,filename) == -1) {
        ...
        return REDIS_ERR;
        }
        redisLog(REDIS_NOTICE,"DB saved on disk");
        server.dirty = 0;
        server.lastsave = time(NULL);
        server.lastbgsave_status = REDIS_OK;
        return REDIS_OK;
          ...
        }
      （2）bgsave命令
      bgsave命令用于在后台异步快照数据到磁盘，收到该命令后调用bgsaveCommand（Rdb.c/1172）函数进而调用rdbSaveBackground（Rdb.c/685）函数，在该函数中Redis fork（Rdb.c/694）出一个子进程，主进程继续处理客户端请求，而子进程则调用rdbSave（Rdb.c/597）函数来负责完成快照，然后退出，子进程的退出状态由serverCron（Redis.c/756）调用backgroundSaveDoneHandler（Rdb.c/1138）来判断，具体可参见这里，也可以看源码。具体处理流程如图1所示。
      （3）sync命令
      master收到slave发送的sync命令后，调用syncCommand（Replication.c/83），进而调用rdbSaveBackground（Rdb.c/685）函数以完成快照，具体流程如图1所示。
      （4）数据变化
        在redis.conf配置文件中如下设置以开启rdb：
save 900 1
      save 300 10
      save 60 10000
      也可以通过命令来达到上面效果，如：
      config set save "900 1 300 10 60 10000"
      当数据在多少秒内出现了多少次变化则触发一次bgsave，触发规则用如上所示方式配置。触发机制由Redis内部定时检测serverCron（Redis.c/756），具体代码如下：
        /* If there is not a background saving/rewrite in progress check if
* we have to save/rewrite now */
for (j = 0; j < server.saveparamslen; j++) {
struct saveparam *sp = server.saveparams+j;

if (server.dirty >= sp->changes &&
server.unixtime-server.lastsave > sp->seconds) {
redisLog(REDIS_NOTICE,"%d changes in %d seconds. Saving...",
sp->changes, sp->seconds);
rdbSaveBackground(server.rdb_filename);
break;
}
}
      如上代码中rdbSaveBackground是亮点，根据前面分析，接下来的事情，你懂的

，具体流程如图1所示。
      （5）flushall命令
      收到flushall命令后，调用flushallCommand（Db.c/188）函数，再调用rdbSave（Rdb.c/597）函数清空rdb数据，以免crash后重新加载数据时载入旧数据。
      （6）shutdown命令
      收到shutdown命令后，调用shutdownCommand（Db.c/305）函数，再调用prepareFroShutdown（Redis.c/1584）函数，进入调用rdbSave（Rdb.c/597）函数以在关闭Redis时持久化rdb数据。

图1 快照rdb流程图

二、语句追加
1、原理
      语句追加即aof（append-only file）类似于MySQL的binlog方式，每条会使Redis内存数据发生改变的命令都会追加到log文件中以完成持久化。
2、流程
      在redis.conf配置文件中如下设置以开启aof：
      appendonly yes
      在redis.conf配置文件中如下设置以指定从page cache刷新数据到磁盘的策略：
      #appendfsync always
      appendfsync everysec
      #appendfsync no
      也可以通过命令来达到上面效果，如：
      config set appendonly yes
      config set appendfsync everysec
      如上配置后，在每次收到并执行命令后如果数据发生变化，会调用函数feedAppendOnlyFile（Aof.c/233），将数据命令写入server.aof_buf（Aof.c/271），下一次主循环调用before_sleep（Redis.c/915）函数时会通过调用flushAppendOnlyFile（Redis.c/85）函数把server.aof_buf（Aof.c/271）里的数据写到aof文件中，具体流程如下图所示：

图2 追加aof流程图

Redis在crash之后，重新启动会读取aof文件并执行其中的所有命令以完成数据恢复。aof除了影响性能外还有一个比较严重的问题就是随着时间的推移，数据频繁变更，aof文件会变得很大，所以需要执行bgrewriteaof命令来重新整理aof文件，只保留最新的kv数据。bgrewriteaof命令执行aof文件重写操作，重写操作只会在没有其它持久化操作正在进行时才会触发，如果有快照则操作会被预定，等到快照完成后再执行，该函数的返回值会告知OK且带上额外信息以说明这一情况，如果已经有别的aof操作，则会该函数会返回一个错误且不会被预定到下次再执行。具体请参看brrewriteaofCommand（Aof.c/834）函数源码。

三、总结
不持久化会带来高性能，充当纯粹的cache时非常合适，但如果需要持久化的场景，就需要二选一了，定时快照对性能影响相对低，但是在两次快照之间存在数据丢失的风险，语句追加丢失数据的风险取决于持久化策略，但性能也会大打折扣。这之间的平衡是由架构师去考量。

阅读(5222) | 评论(1) | 转发(3) |

上一篇：Python之控制结构与函数

下一篇：Libevent源码解析--事件处理框架

给主人留下些什么吧！~~

scq2099yt2013-03-26 14:38:57

文明上网，理性发言...

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6