影响HBase运维的几个因素-auro-ChinaUnix博客

auro的技术园地

首页　| 　博文目录　| 　关于我

auro

博客访问： 219591
博文数量： 37
博客积分： 2649
博客等级：少校
技术积分： 490
用户组：普通用户
注册时间： 2008-11-02 10:31

文章分类

全部博文（37）

Nosql（1）
软件工程（3）
Algorithm（0）
职业（8）
经济社会（0）
精彩转载（1）
Coding（3）
Java（6）
C&&C++（5）
Life（1）
Linux（7）
未分配的博文（2）

文章存档

2012年（3）

2009年（7）

2008年（27）

我的朋友

独孤九贱

相关博文

影响HBase运维的几个因素

分类：数据库开发技术

2012-03-17 22:18:46

一.WriteBufferSize

static final Configuration conf = HBaseConfiguration.create();
static final String table_log_name = “user_log”;
wTableLog = new HTable[tableN];
for (int i = 0; i < tableN; i++) {
wTableLog[i] = new HTable(conf, table_log_name);
wTableLog[i].setWriteBufferSize(5 * 1024 * 1024); //5MB
wTableLog[i].setAutoFlush(false);
}

二.lzo压缩

在hbase中开启lzo压缩

三.备份恢复

导出到本地或者hdfs
导入回hbase
导入tsv文件
mozilla开发的backup工具

四.region server的region数目

五.bloomfilter打开

默认情况下创建的table是不打开bloomfilter的（可通过describe table来确认，如看到BLOOMFILTER => ‘NONE’则表示未打开），对于随机读而言这个影响还是比较明显的，由于bloomfilter无法在之后动态打开，因此创建表时最好就处理好，方法类似如此：create ‘t1′, { NAME => ‘f1′, BLOOMFILTER => ‘ROWCOL’ }。

六.Compact，Split的控制

在HBase中，数据在更新时首先写入WAL 日志(HLog)和内存(MemStore)中，MemStore中的数据是排序的，当MemStore累计到一定阈值时，就会创建一个新的MemStore，并且将老的MemStore添加到flush队列，由单独的线程flush到磁盘上，成为一个StoreFile。于此同时，系统会在zookeeper中记录一个redo point，表示这个时刻之前的变更已经持久化了(minor compact)。

StoreFile是只读的，一旦创建后就不可以再修改。因此Hbase的更新其实是不断追加的操作。当一个Store中的StoreFile达到一定的阈值后，就会进行一次合并(major compact)，将对同一个key的修改合并到一起，形成一个大的StoreFile，当StoreFile的大小达到一定阈值后，又会对 StoreFile进行分割(split)，等分为两个StoreFile。

由于对表的更新是不断追加的，处理读请求时，需要访问Store中全部的StoreFile和MemStore，将它们按照row key进行合并，由于StoreFile和MemStore都是经过排序的，并且StoreFile带有内存中索引，通常合并过程还是比较快的。

实际应用中，可以考虑必要时手动进行major compact，将同一个row key的修改进行合并形成一个大的StoreFile。同时，可以将StoreFile设置大些，减少split的发生。

部分因素参考自HBase运维碎碎念。

阅读(6522) | 评论(0) | 转发(0) |

上一篇：密码学基础

下一篇：整理一下未曾看过的书

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6