Hadoop2.2.0版本多节点集群安装及测试-zzjlzx-ChinaUnix博客

zzjlzxzzjlzx.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zzjlzx

博客访问： 10653863
博文数量： 1669
博客积分： 16831
博客等级：上将
技术积分： 12594
用户组：普通用户
注册时间： 2011-02-25 07:23

个人简介

柔中带刚，刚中带柔，淫荡中富含柔和，刚猛中荡漾风骚，无坚不摧，无孔不入！

文章分类

全部博文（1669）

NGINX（1）
MongoDB（2）
docker（8）
shadowsocks（1）
CloudFoundry（11）
CloudStack（102）
openstack（61）
PHP（0）
mail（0）
hadoop（25）
GemFire（1）
文件系统（4）
CDN（7）
下载及资源（15）
数据缓存（8）
web 加速（9）
分布式文件系统架（23）
虚拟化（133）
同步（6）
网站架构（50）
windows 监控（15）
mysql 监控（5）
oracle 监控（2）
linux 监控（24）
web 监控（35）
其他数据库（27）
备份恢复（28）
VPN及认证（24）
云系统（29）
windows（29）
WEB 故障（13）
mysql 备份（10）
oracle 集群（15）
HA及负载均衡（52）
存储（66）
shell（39）
web 应用（19）
mysql 优化（16）
mysql 故障（14）
mysql 安全（8）
mysql 配置（29）
mysql 应用（10）
web 安全（21）
SAN交换路由（26）
web 优化（46）
基础解释（24）
linux 安全（37）
linux 故障（22）
linux 应用（85）
linux 配置（64）
web 配置（23）
oracle 备份（33）
UNIX（12）
Solaris（5）
Aix（1）
oracle 配置（69）
oracle 优化（62）
oracle 安全（10）
oracle 应用（30）
交流（29）
oracle 故障（59）
linux 优化（31）
未分配的博文（4）

文章存档

2023年（4）

2022年（1）

2021年（10）

2020年（24）

2019年（4）

2018年（19）

2017年（66）

2016年（60）

2015年（49）

2014年（201）

2013年（221）

2012年（638）

2011年（372）

我的朋友

Hadoop2.2.0版本多节点集群安装及测试

＞＞

摘要：本文记录了2.2.0版本多节点集群安装过程，并做了基本配置，启动运行和测试了一个单词统计例子。

环境说明：

基于Windows下的VMware Player4.0.3中的12.04-64server安装，先把基础软件安装到一个虚拟机中，然后拷贝两份再配置下即可。三台机器的分工如下：

Hadoop1(Master): NameNode/ResouceManager

Hadoop2(Slave):DataNode/NodeManager

Hadoop3(Slave): DataNode/NodeManager

假定三台虚拟机的IP地址如下，后面会用到。

Hadoop1:192.168.128.130

Hadoop2:192.168.128.131

Hadoop3:192.168.128.132

一：环境准备：

下载免费的VMware Player并安装好;
下载免费的Ubuntu 12.04 server版并在VMware中安装好；
二：基础安装：

执行如下命令升级部分软件和把ssh安装好
(1)sudo apt-get update;

(2)sudo apt-get upgrade;

(3)sudo apt-get install openssh-server;

安装 JDK
通过webupd8team自动安装，执行命令如下：

(1) sudo apt-get install python-software-properties

(2) sudo add-apt-repository ppa:webupd8team/java

(3) sudo apt-get update

(4) sudo apt-get install oracle-java6-installer

创建hadoop用户
(1) sudo addgroup hadoop

(2) sudo adduser –ingroup hadoop hduser

编辑/etc/sudoers编辑文件，在root ALL=(ALL)ALL行下添加hduser ALL=(ALL)ALL。如果不添加这行，hduser将不能执行sudo操作。

注：以下操作均用hduser用户登录后操作。

三：公共安装：

注：以下操作以hduser登录进行操作。

下载Hadoop2.2.0版本
(1) cd /home/hduser

(2) $ wget

(3) $ tar zxf hadoop-2.2.0.tar.gz

(4) $ mv hadoop-2.2.0 hadoop

配置Hadoop
(1) 配置/home/hduser/hadoop/etc/hadoop/hadoop-env.sh

替换exportJAVA_HOME=${JAVA_HOME}为如下：

export JAVA_HOME=/usr/lib/jvm/java-6-oracle

(2) 配置/home/hduser/hadoop/etc/hadoop/core-site.xml，

在中添加如下：

hadoop.tmp.dir

/home/hduser/hadoop/tmp/hadoop-${user.name}

A base for other temporary directories.

fs.default.name

hdfs://192.168.128.130:8010

The name of the default file system. A URI whose

schemeand authority determine the FileSystem implementation. The

uri’sscheme determines the config property (fs.SCHEME.impl) naming

theFileSystem implementation class. Theuri’s authority is used to

determine the host, port, etc. for a filesystem.

注意：以下两点务必确保正确，否则后面会出错。

a. 需执行mkdird home/hduser/hadoop/tmp创建这个临时目录;

b. 这个fd.default.name值的IP地址为NameNode的地址，即Hadoop1。

配置/home/hduser/hadoop/etc/hadoop/mapred-site.xml
(1) mv /home/hduser/hadoop/etc/hadoop/mapred-site.xml.template/home/hduser/hadoop/etc/hadoop/mapred-site.xml

(2) 在中添加如下：

mapred.job.tracker

192.168.128.130:54311

The host and port that theMapReduce job tracker runs

at. If “local”, thenjobs are runin-process as a single map

and reducetask.

配置/home/hduser/hadoop/etc/hadoop/hdfs-site.xml
在中添加如下：

dfs.replication

Default block replication.

Theactual number of replications can be specified when the file is created.

Thedefault is used if replication is not specified in create time.

四：整体安装

将上面安装和配置好的虚拟机拷贝两份，即Hadoop2和Hadoop3。
分别修改三台虚拟机的/etc/hostname中的内容改为相应的主机名，即
hadoop1的hostname为hadoop1，其他类推。

修改完成后需要重启，并通过命令hostname确认已经生效。

分别检查并修改三台虚拟机的/etc/hosts中的内容，确保包含如下配置：
192.168.128.130 hadoop1

192.168.128.131 hadoop2

192.168.128.132 hadoop3

为三台虚拟机之间建立SSH信任以便是实现无需密码登陆。
(1) 将以下命令分别在三台机子上做一遍：

$echo”" > .ssh/authorized_keys

$ssh-keygen-t rsa -P “”

$cat.ssh/id_rsa.pub >>.ssh/authorized_keys

(2) 分别将各台机子上的.ssh/id_rsa.pub的内容追加到其他两台的.ssh/authorized_keys中，这样三台机子相互访问就不需要输入密码了。可通过ssh hadoop1来测试。

分别修改各台机子的$HADOOP_HOME/etc/hadoop/slaves，这里$HADOOP_HOME为你的hadoop安装目录。Slaves的内容如下：
hadoop2

hadoop3

五：运行

注：所有的运行只需要在hadoop1的master节点即可。系统会自动登录到其他两台去启动相应的节点。

在初次运行Hadoop的时候需要初始化Hadoop文件系统，命令如下：

$cd /home/hduser/hadoop/bin

$./hdfs namenode -format

如果执行成功，你会在日志中(倒数几行)找到如下成功的提示信息：

common.Storage: Storage directory /home/hduser/hadoop/tmp/hadoop-hduser/dfs/namehas been successfully formatted.

运行命令如下：

$cd home/hduser/hadoop/sbin/

$./start-dfs.sh

$./start-yarn.sh

启动完之后可分别用jps命令查看各个机子的进程是否正常，如下：

hduser@hadoop1:~/hadoop$jps

1777 ResourceManager

1464 NameNode

1618 SecondaryNameNode

hduser@hadoop2:~$ jps

1264 DataNode

1344 NodeManager

hduser@hadoop3:~$ jps

1289 NodeManager

1209 DataNode

还可以通过bin/hdfs dfsadmin -report查看dfs是否正常，相应如下：

hduser@hadoop1:~/hadoop$ bin/hdfs dfsadmin -report

Configured Capacity:40668069888 (37.88 GB)

Present Capacity:34336370688 (31.98 GB)

DFS Remaining:34334142464 (31.98 GB)

DFS Used: 2228224(2.13 MB)

DFS Used%: 0.01%

Under replicatedblocks: 0

Blocks with corruptreplicas: 0

Missing blocks: 0

-------------------------------------------------

Datanodes available:2 (2 total, 0 dead)

Live datanodes:

Name:192.168.128.131:50010 (hadoop2)

Hostname: hadoop2

Decommission Status: Normal

Configured Capacity:20334034944 (18.94 GB)

DFS Used: 1114112(1.06 MB)

Non DFS Used:3165851648 (2.95 GB)

DFS Remaining:17167069184 (15.99 GB)

DFS Used%: 0.01%

DFS Remaining%:84.43%

Last contact: MonOct 28 19:12:16 PDT 2013

Name:192.168.128.132:50010 (hadoop3)

Hostname: hadoop3

Decommission Status: Normal

Configured Capacity:20334034944 (18.94 GB)

DFS Used: 1114112(1.06 MB)

Non DFS Used:3165847552 (2.95 GB)

DFS Remaining:17167073280 (15.99 GB)

DFS Used%: 0.01%

DFS Remaining%:84.43%

Last contact: MonOct 28 19:12:16 PDT 2013

六：查看资源管理器

，将其中的192.168.128.130替换为你的Hadoop1的IP地址。

七：测试Hadoop

cd /home/hduser

$wget

$cd hadoop

$ bin/hdfs dfs -mkdir /tmp

$ bin/hdfs dfs -copyFromLocal /home/hduser/pg20417.txt /tmp

bin/hdfs dfs -ls /tmp

$bin/hadoop jar ./share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jarwordcount /tmp/ /tmp-output

如果一切正常的话，会输入相应的结果，可以从屏幕输出看到。

八：停止Hadoop

若停止hadoop，依次运行如下命令：

$./stop-yarn.sh

$./stop-dfs.sh

九：集群安装与单机安装的区别分析

core-site.xml中配置的fs.default.name值的IP地址必须为Master节点，本文为Hadoop1节点；
hdfs-site.xml中配置的dfs.replication值需要与实际的DataNode节点数一致，本文为2；
mapred-site.xml中配置的mapred.job.tracker值的IP地址必须为Master节点，本文为Hadoop1节点；
slaves文件必须配置上实际的slaves节点，本文为hadoop2和hadoop3；
每个主机的/etc/hostname和/etc/hostname必须做相应的配置以方便集群内部相互识别；
必须在集群内部用ssh建立起信任。

以上安装过程中还是出现了一些问题，但基本都通过baidu和google解决了。有个错误花费了较多时间，这里记录下，以供参考。

错误现象：13/10/2807:19:03 WARN hdfs.DFSClient: DataStreamer Exception org.apache.hadoop.ipc.RemoteException(java.io.IOException):File /tmp/pg20417.txt._COPYING_ could only be replicated to 0 nodes instead ofminReplication (=1). There are 0datanode(s) running and no node(s) are excluded in this operation.

发生地方：执行bin/hdfs dfs -copyFromLocal /home/hduser/pg20417.txt /tmp时

原因定位：后来经过反复查看，是因为fs.default.name的值中的IP地址配置成 localhost了，导致系统找不到hdfs.是在datanode的日志中发现这个错误的，日志如下：

2013-10-28 07:33:55,963 WARNorg.apache.hadoop.hdfs.server.datanode.DataNode: Problem connecting to server:localhost/127.0.0.1:8010

解决办法：将fs.default.name中的IP地址改为192.168.128.130，即你的master节点的IP地址。

更多Hadoop相关信息见专题页面

更多详情见请继续阅读下一页的精彩内容：

相关阅读：

Hadoop 2.0 安装向导 (0.23.x)

Hadoop 1.2.1 单节点安装(Single Node Setup)步骤

在上安装Hadoop

Ubuntu 12.04安装Hadoop

CentOS 6.3 x86_64安装与配置Hadoop-1.0