走进cassandra之五：存储机制-laoliulaoliu-ChinaUnix博客

miraclemiracle.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

laoliulaoliu

博客访问： 4663374
博文数量： 1214
博客积分： 13195
博客等级：上将
技术积分： 9105
用户组：普通用户
注册时间： 2007-01-19 14:41

个人简介

C++,python,热爱算法和机器学习

文章分类

全部博文（1214）

cloud（3）
operation（9）
tornado（4）
mac_os（1）
golang（4）
架构（13）
git（4）
security（29）
shell（1）
macbook（1）
ruby（13）
javascript（15）
design（3）
testing（1）
mac（1）
bigdata（69）
nosql（46）
R（9）
gcj/acm（6）
NLP（10）
小说（3）
matlab（4）
web（44）
java（66）
product（7）
c#（1）
language（4）
machine learning（76）
science（4）
opencourse（2）
windows（3）
search（33）
algorithm（65）
database（51）
compiler（11）
ACE（5）
poem（1）
programming（29）
python（140）
assembly（1）
linux（49）
C++（16）
book（2）
cate（1）
phliosophy（3）
mental（30）
Science fiction（1）
Software（5）
c（23）
network（65）
CS（15）
thinking（10）
BSD（13）
solaris10（2）
life（57）
Debian（16）
economy（7）
Mathematics（57）
OS（8）
ibm（2）
gentoo（32）
未分配的博文（8）

文章存档

2021年（13）

2020年（49）

2019年（14）

2018年（27）

2017年（69）

2016年（100）

2015年（106）

2014年（240）

2013年（5）

2012年（193）

2011年（155）

2010年（93）

2009年（62）

2008年（51）

2007年（37）

我的朋友

相关博文

走进cassandra之五：存储机制

分类：大数据

2014-05-28 11:24:10

文章来源：http://blog.csdn.net/qinzhihu/article/details/8807579

先上个图。
这个图总的意思就是说，
数据先写入内存中的Memtable，Memtable达到条件后刷新到磁盘，保存为SSTable，同一个CF的多个SSTable可以合并(Compaction)以优化读操作

commit log -> memtable -> sstable -> compaction.
看起来似乎有些麻烦，存个数据要这么多弯弯绕，但是记得，兄弟们，现在是应付海量数据，同时有很多节点，所以必须要走这么多弯路。

memtable是啥呢，所谓mem, mem,就是memory，内存，放在内存的table。
数据放内存有啥好处呢？
一个字：快。
因为离CPU最近的，就是内存.

找数据的时候，先去内存里找，找不到再去硬盘找。
从硬盘上找东西的时候，要注意一点，因为硬盘比较矫情。
很容易发生i/o block。

为了应付这个矫情，cassandra找了Bloom兄弟来帮忙。
有个算法叫 Bloom Filter，
可以通过布隆过滤算法(Bloom Filter)减少对不可能包含查询key的SSTable的读取。

说了半天，啥是SSTable呢？
大家伙可以去自己硬盘上看一看：

SSTable包含对应的三种文件
Datafile
     按照Key排序顺序保存的数据文件
     文件名称格式如下：ColumnFamilyName-序号-Data.db
Indexfile
    保存每个Key在Datafile中的位置偏移
    文件名称格式如下： ColumnFamilyName-序号-Filter.db
Filterfile
    保存BloomFilter的Key查找树
    文件名称格式如下： ColumnFamilyName-序号-index.db

大家伙实际看下，估计能有个感观印象了。

sstable多了也占空间，麻烦，可以使劲压一压，压扁了，就不占那么大地儿了。
压扁的过程，在cassandra里面，叫compaction.

一个CF可能有很多SSTable，系统会将多个SSTable合并排序后保存为一个新的SSTable，称之为Compaction。
一次compaction最多请求合并32个SSTable，最少4个。超过32个则按时间排序分批进行（这两个阈值可以设置）。
如果空间不足，则尝试去掉最大的SSTable再合并，如果连合并两个最小的SSTable的空间都不足，则告警。
Major Comaction：合并CF的所有SSTable为一个新的SSTable，同时执行垃圾数据(已标记删除的数据tombstone)清理。
Minor Compaction：只合并大小差不多的SSTable，超过4个需要合并的SSTable就会自动触发。
可通过nodetool compact命令手动触发。
数据目录最好保持50%以上的可用空间。

就好像雷锋做了好事，要写在日记本上一样，咱凡事都有个log文件。
cassandra也有一个，叫 commitlog.

Commitlog是server级别的，不是Column Family级别的，每一个节点上的Commitlog都是统一管理。
每个Commitlog文件的大小是固定的，称之为一个CommitlogSegment，目前版本(0.7.0)中，这个大小是128MB，硬编码在代码中。
当一个Commitlog文件写满以后，会新建一个的文件。
SSTable持久后不可变更，故Commitlog只用于Memtable的恢复，相当于Oracle的Instance Recovery。Cassandra不需要做Media Recover
当节点异常重启后，将根据SSTable和Commitlog进行实例恢复，在内存中重新恢复出宕机前的Memtable。
当一个Commitlog文件对应的所有CF的Memtable都刷新到磁盘后，该Commitlog就不再需要，系统会自动清除

阅读(1411) | 评论(0) | 转发(0) |

上一篇：走进cassandra之四：副本机制

下一篇：走进cassandra之六：数据读写删

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6