Chinaunix首页 | 论坛 | 博客
  • 博客访问: 799380
  • 博文数量: 50
  • 博客积分: 757
  • 博客等级: 上士
  • 技术积分: 1913
  • 用 户 组: 普通用户
  • 注册时间: 2011-03-29 14:29
个人简介

DBA

文章分类

全部博文(50)

文章存档

2015年(3)

2014年(2)

2013年(14)

2012年(19)

2011年(12)

分类: Mysql/postgreSQL

2012-10-22 19:17:14

Mongodb在1.8版本之后开始支持journal,就是我们常说的redo log,用于故障恢复和持久化。

一、启动

      启动journal功能使用mongod --journal选项,也可以关闭--nojournal,在2.0之后的版本,journal都是默认打开的,以确保数据安全。在version < 2.0 或者32位的系统上都是默认关闭的 。因为打开journal会使用更多的内存(下面会详细介绍),而32位系统支持的内存太小,所以关闭了。
      由于Mongodb会事先初始化journal空间,而且在初始化完成之前是不会打开监听端口的,所以启动后可能会有一段时间连不上,不用紧张,查看日志,待journal初始化完成之后再连接。这里也建议,尽量使用ext4或者xfs等文件系统,诸如ext3这样的文件系统,初始化磁盘会非常慢,你会看到启动mongod之后,很长一段时间都停留在打印日志的状态,而用ext4会瞬间完成。而且Mongodb在运行时对db的空间也采用预分配的机制,所以使用更高级的文件系统是很有帮助的,防止磁盘引起的高并发下拥堵问题。

二、文件、恢复和备份

       journal存放在数据文件的/journal/文件夹下,运行时的文件一般是这样的

12321312

      其中j.32,j.33是使用中的journal文件,当单个文件达到1GB的时候,就会创建一个新的文件,旧文件不会循环使用,自动删除。lsn保存最后使用的journal序列号,是个2进制文件,它实际保存的是系统启动到现在的一个时间戳。prealloc.2是还未使用的初始化的journal文件。使用db.shutdownServer()和kill -2关闭的系统,也就是clean shutdown,journal文件夹下除prealloc.*文件 都会被删除。
      如果系统掉电或者运行时死机,再启动时,mongo就会使用journal进行恢复,不用运行repair。
      我们可以将journal,oplog,data做快照备份,在数据丢失的时候,可以恢复到最近的状态,保证安全。盛大的云计算系统就是这样做的,同时使用go语言做异步备份,有机会可以跟他们交流。 

三、批量提交

      journal除了故障恢复的作用之外,还可以提高写入的性能,批量提交(batch-commit),journal一般默认100ms刷新一次,在这个过程中,所有的写入都可以一次提交,是单事务的,全部成功或者全部失败。关于刷新时间,它是可以更改,上一篇博客有介绍,范围是2-300ms,但是这并不是绝对的。mongodb提供了journal延迟测试的函数,

db.runCommand("journalLatencyTest"):

latency

       在实际运行中,刷新时间是--journalCommitInterval设置和延迟测试中较大的一个。 
       不得不吐槽一下,有的服务器磁盘有cache却没有电池,情何以堪,在不走cache的情况下,延迟相当大,图中就是不走cache的情况。mongo也是支持ssd的,有条件可以使用。在比较繁忙的系统上,当journal和data放在一个volume上的时候,这个值也会比较大。
查看journal运行情况
db.serverStatus():

2123

commits:在journalCommitInterval时间内提交的操作数。
journaledMB:在journalCommitInterval时间内写到journal文件中的数据量 。
writeToDataFilesMB:在journalCommitInterval时间内从journal刷新到磁盘的数据量 。
compression:v>2.0,表示客户端提交写入到journal的数据的压缩比率,注意,写入到journal的数据并不是全部的数据。( journaled_size_of_data / uncompressed_size_of_data ) 。
commitsInWriteLock:在有写锁的情况下提交的数量,这表示写的压力很大。
earlyCommits:表示在journalCommitInterval之前的时间,mongod请求提交的次数。用这个参数确定journalCommitInterval是不是设置的过长。
dur.timeMS.prepLogBuffer:从privateView映射到Logbuffer的时间。
dur.timeMS.writeToJournal:从logbuffer刷新到journalfile 的时间。
dur.timeMS.writeToDataFiles:从journalbuffer映射到MMF,然后从MMF刷新到磁盘的时间,文件系统和磁盘会影响写入性能。
dur.timeMS.remapPrivateView:重新映射数据到PrivateView的时间,越小性能越好。这个之后会介绍,这也是为什么journal会使用更多内存的原因,因为journal会另外使用一个叫PrivateView的内存区域。

总结:

        mongodb在使用journal之后,备份,容灾得到保障,批量提交也使得写入更加快速(不持久化的不算)。我们也需要选用较高级的文件系统和磁盘还有更多的内存来保障journal的良好运行。下一篇博客会着重介绍journal的数据结构和工作原理。

 

参考:
阅读(25178) | 评论(4) | 转发(0) |
给主人留下些什么吧!~~

horizonhyg2013-12-07 11:16:13

chang290:楼主,你的文章,这句话有误     
     journal除了故障恢复的作用之外,还可以提高写入的性能,批量提交(batch-commit),journal一般默认100ms刷新一次,在这个过程中,所有的写入都可以一次提交,是单事务的,全部成功或者全部失败
     这句话的前面不分“ journal除了故障恢复的作用之外,还可以提高写入的性能”,容易让人误解,提高数据文件的写入性能。实际上这里的批量提高是为了提高jounal文件的写入性能,以尽可能降低对整体mongo性能的影响。

恩,是的,journal更多的是为了安全考虑,当时写的时候没有注意,谢谢指正。

回复 | 举报

chang2902013-12-06 15:45:26

楼主,你的文章,这句话有误     
     journal除了故障恢复的作用之外,还可以提高写入的性能,批量提交(batch-commit),journal一般默认100ms刷新一次,在这个过程中,所有的写入都可以一次提交,是单事务的,全部成功或者全部失败
     这句话的前面不分“ journal除了故障恢复的作用之外,还可以提高写入的性能”,容易让人误解,提高数据文件的写入性能。实际上这里的批量提高是为了提高jounal文件的写入性能,以尽可能降低对整体mongo性能的影响。

horizonhyg2013-05-23 16:50:08

wind35:请问linux系统下,为什么该文件夹总占很大磁盘空间?使用副本集模式启动了2个mongod,每个data文件中的journal有3G大,总提示磁盘空间不够。导致启动设置后一个是primary 另一个总是recovering。

如果开启journal默认就会初始化3G的journal文件,有几十G的磁盘应该不成问题吧,如果写入量不大,你可以改小oplog,设置oplogSize,2.+版本都是默认开始journal,关闭journal使用--nojournal,不过要承担丢失数据的风险。还是建议你换个大硬盘。。。

回复 | 举报

wind352013-05-23 00:11:24

请问linux系统下,为什么该文件夹总占很大磁盘空间?使用副本集模式启动了2个mongod,每个data文件中的journal有3G大,总提示磁盘空间不够。导致启动设置后一个是primary 另一个总是recovering。