安装Hadoop完全分布式模式-skyajlm-ChinaUnix博客

快乐工作,快乐生活skyajlm.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

skyajlm

博客访问： 505345
博文数量： 78
博客积分： 1771
博客等级：上尉
技术积分： 944
用户组：普通用户
注册时间： 2007-04-25 10:20

文章分类

全部博文（78）

存储（1）
服务器软件（1）

Redhat clus（1）

Hadoop（0）

Redis（0）
编程（21）

boost（1）

C++（5）

Java（3）

图（0）

排序（0）

树（0）

链表（1）

数据结构（0）

C语言（11）
Embedded System（15）

Am335x（7）

PCI（3）

AM35x（0）

ARM（1）

PowerPC（4）

单片机（0）
Android（1）
问题集锦（4）
读书笔记（2）

C与指针（1）
工作笔记（5）

CGI（0）
图像图形（0）
嵌入式（1）
Linux（25）

网络（12）

Shell（0）
未分配的博文（2）

文章存档

2014年（2）

2013年（10）

2012年（9）

2011年（7）

2010年（11）

2009年（10）

2008年（12）

2007年（17）

我的朋友

最近访客

推荐博文

安装Hadoop完全分布式模式

分类：

2012-03-28 17:53:42

原文地址：安装Hadoop完全分布式模式作者：pj568

Hadoop完全分布式模式

目录 []

实验环境

系统： centos 5.6
JDK : jdk-6u26-linux-i586-rpm.bin
账号： hadoop
目录： /usr/local/hadoop
主机名：master slave1 slave2

实验目的

组建三台机器的群集

master：部署namecode，JobTracker，DataNode，TaskTracker
slave1：部署JobTracker，DataNode，TaskTracker
slave2：部署JobTracker，DataNode，TaskTracker

其实这个不是最好的组建方法。实验为了更好的测试多节点而这样设置。

安装

请确保每台机器都安装了sun jdk 将hadoop安装在相同的目录（/usr/local/hadoop）。
请确保hadoop/conf/hadoop-env.sh 中JAVA_HOME=/usr/java/jdk1.6.0_26 设置并且正确。
每台机器创建hadoop账户。

#useradd hadoop #passwd hadoop

确保master能无密码登录。

$ssh-keygent -t dsa (我将密码设置为空方便测试。正常环境请安装keychain，) $cd .ssh $cat cat id_rsa.pub > authorized_keys $chmod 600 authorized_keys (将权限设置为600否者ssh将不读取公钥信息)

- 分发public key

$ssh-copy-id slave1 $ssh-copy-id slave2配置文件概述

NameNode ： core-site.xml
JobTracker ： mapred-site.xml
DataNode ： hdfs-site.xml
master ： masters
slave ： slaves

配置

编辑namenode的配置文件

$vi core-site.xml fs.default.name hdfs://192.168.60.149:9000/ hadoop.tmp.dir /usr/local/hadoop/hadooptmp

编辑JobTracker的配置

$vi mapred-site.xml mapred.job.tracker 192.168.60.149:9001 mapred.local.dir /usr/local/hadoop/mapred/local mapred.system.dir /tmp/hadoop/mapred/system

编辑DataNode配置

$vi hdfs-site.xml dfs.name.dir /usr/local/hadoop/hdfs/name dfs.data.dir /usr/local/hadoop/hdfs/data dfs.replication 3

修改slave1，slave2的配置
- 修改slave1，slave2的JobTracker的配置

$vi mapred-site.xml mapred.job.tracker 192.168.60.149:9001 mapred.local.dir /usr/local/hadoop/mapred/local mapred.system.dir /tmp/hadoop/mapred/system

- 修改slave1，slave2的DataNode配置

$vi hdfs-site.xml dfs.name.dir /usr/local/hadoop/hdfs/name dfs.data.dir /usr/local/hadoop/hdfs/data dfs.replication 3

设置master

$vi masters master

设置slave

$vi slaves master slave1 slave2运行

格式化namenode

$$bin/hadoop namenode -format

启动所有进程

$/usr/local/hadoop/bin/start-all.sh starting namenode, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-namenode-master.out master: starting datanode, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-datanode-master.out slave2: starting datanode, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-datanode-slave2.out slave1: starting datanode, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-datanode-slave1.out master: starting secondarynamenode, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-secondarynamenode-master.out starting jobtracker, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-jobtracker-master.out slave1: starting tasktracker, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-tasktracker-slave1.out slave2: starting tasktracker, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-tasktracker-slave2.out master: starting tasktracker, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-tasktracker-master.out测试

分布式文件系统测试

- 查看 nodes里面是3证明三个节点正常接入
- 创建测试pustest文件夹用于分布式文件系统测试

$bin/hadoop dfs -mkdir pustest

- 将conf/hadoop-env.sh放到pushtest目录用于测试。

$bin/hadoop dfs -put conf/hadoop-env.sh pushtest

- Browse the filesystem 发现跳转slave1 or slave2 证明分布式文件系统正常。
hadoop默认开放web状态展示访问地址为

简单的daemo

hadoop自带一些简单的实例。测试下单词统计功能。 $bin/hadoop jar hadoop-examples-0.20.203.0.jar wordcount pushtest testoutput 运行后将可以在web界面看见job的状态。和完成的状态。具体单词数量等统计结果要查看 $bin/hadoop fs -ls drwxr-xr-x - hadoop supergroup 0 2011-07-11 11:13 /user/hadoop/test drwxr-xr-x - hadoop supergroup 0 2011-07-11 11:15 /user/hadoot/testoutput $bin/hadoop fs -ls testoutput Found 3 items -rw-r--r-- 1 hadoop supergroup 0 2011-07-11 16:31 /user/hadoop/shanyang1/_SUCCESS drwxr-xr-x - hadoop supergroup 0 2011-07-11 16:30 /user/hadoop/shanyang1/_logs -rw-r--r-- 1 hadoop supergroup 32897 2011-07-11 16:31 /user/hadoop/shanyang1/part-r-00000 $bin/hadoop fs -cat /user/hadoop/shanyang1/part-r-00000 将可以看到详细的统计信息

阅读(690) | 评论(0) | 转发(0) |

上一篇：UML中关系图解

下一篇：12.04 ubuntu andriod devlopment envirorment

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6