birdofpreybirdofprey.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

niao5929

博客访问： 7338456
博文数量： 3857
博客积分： 6409
博客等级：准将
技术积分： 15948
用户组：普通用户
注册时间： 2008-09-02 16:48

个人简介

迷彩潜伏隐蔽伪装

文章分类

全部博文（3857）

大数据计算（149）
随想（82）
编程语言（372）

python（3）

lisp（0）

JAVA C++（2）

GOLANG（0）
数据库（115）
高可用集群（412）

分布式系统（26）

SDN（0）

细胞节点（78）

分布式网络（5）
Linux（1172）

SHELL（10）

网络（209）
未分配的博文（1555）

文章存档

2017年（5）

2016年（63）

2015年（927）

2014年（677）

2013年（807）

2012年（1241）

2011年（67）

2010年（7）

2009年（36）

2008年（28）

我的朋友

HBase和Zookeeper的安装和部署

[日期：2015-02-25]

来源：Linux社区作者：smartloli

[字体： ]

1.概要

1.1HBase的使用场景

? 大数据量（100s TB级数据）且有快速随机访问的需求。

? 例如淘宝的交易历史记录。数据量巨大无容置疑，面向普通用户的请求必然要即时响应。

? 容量的优雅扩展。

? 大数据的驱使，动态扩展系统容量的必须的。例如：webPage DB。

? 业务场景简单，不需要关系数据库中很多特性（例如交叉列、交叉表，事务，连接等等）。

? 优化方面：合理设计rowkey。因为hbase的查询用rowkey是最高效的，也几乎的唯一生产环境可行的方式。所以把你的查询请求转换为查询rowkey的请求吧。

1.2软件准备

hbase-0.98.8 【】

zookeeper-3.4.6 【】

2.配置

sudo vi /etc/profile
HBASE_HOME=/home//source/hbase-0.98.8 ZK_HOME=/home/hadoop/source/zookeeper-3.4.6 PATH=$HBASE_HOME/bin:$ZK_HOME/bin
export HBASE_HOME ZK_HOME

hbase-env.sh

export JAVA_HOME=/usr/jdk1.7

启动shell：

hbase shell

启动hbase：

start-hbase.sh

3.ZK

3.1概要

zk可以用来保证数据在zk集群之间事务性一致，如：

删除Server1中的数据后，其他集群的Server会自动同步删除之后的数据。

3.2安装

集群的规模小于等于3，各个集群的系统时间必须一致。
安装

（1）解压zk的压缩包到指定位置。

（2）修改conf文件，cp zoo_sample.cfg zoo.cfg

（3）编辑zoo.cfg 修改dataDir=/home/zk/data 新增 server.0=hadoop0:2888:3888 server.1=hadoop1:2888:3888 server.2=hadoop2:2888:3888

（4）创建文件夹 mkdir /home/zk/data 在data目录下，创建文件myid，值为0

（5）用scp命令分发zk文件夹到集群

3.3启动/验证

启动zk的服务：zkServer.sh start

验证zk的启动状态：zkServer.sh status

4奇数选举

zookeeper的集群数推荐配置奇数，Leader选举算法采用了Paxos协议，该协议的核心思想是当多数Server写成功时，则任务数据写成功，如：

有3个Server，则两个写成功即可；
有4或5个Server，则三个写成功即可；
如果有3个Server，则最多运行1个Server挂掉
如果有4个Server，则同样最多运行1个Server挂掉

由此，我们可以看出3台服务器和4台服务器的容灾能力是一样的，所以为了节约服务器资源，一般我们采用奇数个数，作为服务器部署个数。

Hadoop+ZooKeeper+HBase集群配置

Hadoop集群安装&HBase实验环境搭建

基于Hadoop集群的HBase集群的配置 ‘

Hadoop安装部署笔记之-HBase完全分布模式安装

单机版搭建HBase环境图文教程详解

HBase 的详细介绍：
HBase 的下载地址：

本文永久更新链接地址：

阅读(632) | 评论(0) | 转发(0) |

上一篇：Hadoop不适合处理实时数据的原因剖析

下一篇：Hadoop2.2.0伪分布式搭建

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6