安装Hadoop完全分布式模式-godymoon-ChinaUnix博客

TTTTTTET

首页　| 　博文目录　| 　关于我

godymoon

博客访问： 1992964
博文数量： 498
博客积分： 2078
博客等级：大尉
技术积分： 1645
用户组：普通用户
注册时间： 2008-11-18 22:43

个人简介

安大

文章分类

全部博文（498）

未分配的博文（498）

文章存档

2017年（1）

2016年（2）

2015年（21）

2014年（90）

2013年（101）

2012年（267）

2011年（16）

我的朋友

最近访客

推荐博文

安装Hadoop完全分布式模式

分类：

2012-03-28 09:39:32

原文地址：安装Hadoop完全分布式模式作者：pj568

Hadoop完全分布式模式

目录 []

实验环境

系统： centos 5.6
JDK : jdk-6u26-linux-i586-rpm.bin
账号： hadoop
目录： /usr/local/hadoop
主机名：master slave1 slave2

实验目的

组建三台机器的群集

master：部署namecode，JobTracker，DataNode，TaskTracker
slave1：部署JobTracker，DataNode，TaskTracker
slave2：部署JobTracker，DataNode，TaskTracker

其实这个不是最好的组建方法。实验为了更好的测试多节点而这样设置。

安装

请确保每台机器都安装了sun jdk 将hadoop安装在相同的目录（/usr/local/hadoop）。
请确保hadoop/conf/hadoop-env.sh 中JAVA_HOME=/usr/java/jdk1.6.0_26 设置并且正确。
每台机器创建hadoop账户。

#useradd hadoop #passwd hadoop

确保master能无密码登录。

$ssh-keygent -t dsa (我将密码设置为空方便测试。正常环境请安装keychain，) $cd .ssh $cat cat id_rsa.pub > authorized_keys $chmod 600 authorized_keys (将权限设置为600否者ssh将不读取公钥信息)

- 分发public key

$ssh-copy-id slave1 $ssh-copy-id slave2配置文件概述

NameNode ： core-site.xml
JobTracker ： mapred-site.xml
DataNode ： hdfs-site.xml
master ： masters
slave ： slaves

配置

编辑namenode的配置文件

$vi core-site.xml fs.default.name hdfs://192.168.60.149:9000/ hadoop.tmp.dir /usr/local/hadoop/hadooptmp

编辑JobTracker的配置

$vi mapred-site.xml mapred.job.tracker 192.168.60.149:9001 mapred.local.dir /usr/local/hadoop/mapred/local mapred.system.dir /tmp/hadoop/mapred/system

编辑DataNode配置

$vi hdfs-site.xml dfs.name.dir /usr/local/hadoop/hdfs/name dfs.data.dir /usr/local/hadoop/hdfs/data dfs.replication 3

修改slave1，slave2的配置
- 修改slave1，slave2的JobTracker的配置

$vi mapred-site.xml mapred.job.tracker 192.168.60.149:9001 mapred.local.dir /usr/local/hadoop/mapred/local mapred.system.dir /tmp/hadoop/mapred/system

- 修改slave1，slave2的DataNode配置

$vi hdfs-site.xml dfs.name.dir /usr/local/hadoop/hdfs/name dfs.data.dir /usr/local/hadoop/hdfs/data dfs.replication 3

设置master

$vi masters master

设置slave

$vi slaves master slave1 slave2运行

格式化namenode

$$bin/hadoop namenode -format

启动所有进程

$/usr/local/hadoop/bin/start-all.sh starting namenode, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-namenode-master.out master: starting datanode, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-datanode-master.out slave2: starting datanode, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-datanode-slave2.out slave1: starting datanode, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-datanode-slave1.out master: starting secondarynamenode, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-secondarynamenode-master.out starting jobtracker, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-jobtracker-master.out slave1: starting tasktracker, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-tasktracker-slave1.out slave2: starting tasktracker, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-tasktracker-slave2.out master: starting tasktracker, logging to /usr/local/hadoop/bin/../logs/hadoop-yueyang-tasktracker-master.out测试

分布式文件系统测试

- 查看 nodes里面是3证明三个节点正常接入
- 创建测试pustest文件夹用于分布式文件系统测试

$bin/hadoop dfs -mkdir pustest

- 将conf/hadoop-env.sh放到pushtest目录用于测试。

$bin/hadoop dfs -put conf/hadoop-env.sh pushtest

- Browse the filesystem 发现跳转slave1 or slave2 证明分布式文件系统正常。
hadoop默认开放web状态展示访问地址为

简单的daemo

hadoop自带一些简单的实例。测试下单词统计功能。 $bin/hadoop jar hadoop-examples-0.20.203.0.jar wordcount pushtest testoutput 运行后将可以在web界面看见job的状态。和完成的状态。具体单词数量等统计结果要查看 $bin/hadoop fs -ls drwxr-xr-x - hadoop supergroup 0 2011-07-11 11:13 /user/hadoop/test drwxr-xr-x - hadoop supergroup 0 2011-07-11 11:15 /user/hadoot/testoutput $bin/hadoop fs -ls testoutput Found 3 items -rw-r--r-- 1 hadoop supergroup 0 2011-07-11 16:31 /user/hadoop/shanyang1/_SUCCESS drwxr-xr-x - hadoop supergroup 0 2011-07-11 16:30 /user/hadoop/shanyang1/_logs -rw-r--r-- 1 hadoop supergroup 32897 2011-07-11 16:31 /user/hadoop/shanyang1/part-r-00000 $bin/hadoop fs -cat /user/hadoop/shanyang1/part-r-00000 将可以看到详细的统计信息

阅读(944) | 评论(0) | 转发(0) |

上一篇：用Javascript实现Windows任务管理器

下一篇：Mysql数据库优化总结

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6