ubuntu server 12.04 安装 hadoop-1.0.2集群-cywcdwxjf-ChinaUnix博客

一片浮云而已vlinuxos.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

cywcdwxjf

博客访问： 1909957
博文数量： 473
博客积分： 13997
博客等级：上将
技术积分： 5953
用户组：普通用户
注册时间： 2010-01-22 11:52

文章分类

全部博文（473）

OCaml（6）
C/C++（33）
集群（6）
电子地图（7）
编译（2）
其它（7）
测试（2）
嵌入式（101）
服务器（16）
云计算（13）
期货（3）
数据库（14）
网络（36）
Linux（73）
Wine（2）
系统技术（45）
虚拟化（85）
WindowsXP（5）
脚本（11）
易丽系统（0）
未分配的博文（6）

文章存档

2014年（8）

2013年（38）

2012年（95）

2011年（181）

2010年（151）

我的朋友

最近访客

推荐博文

ubuntu server 12.04 安装 hadoop-1.0.2集群

分类：

2012-10-24 16:21:12

原文地址：ubuntu server 12.04 安装 hadoop-1.0.2集群作者：zenir

环境如下：
ubuntu server x86_64 12.04
hadoop 1.0.2

1) master和slave /etc/hosts文件修改

点击(此处)折叠或打开

hadoop@hadoop-master:~$ cat /etc/hosts
192.168.10.100 slave1 hadoop-slave1
192.168.10.101 master hadoop-master
192.168.10.102 slave2 hadoop-slave2

2) 创建统一用户hadoop并且实现ssh认证登录（master可以无密码登录slave）

点击(此处)折叠或打开

hadoop@hadoop-master:~$sudo useradd -m -s /bin/bash -G sudo hadoop
hadoop@hadoop-master:~$sudo apt-get install ssh
hadoop@hadoop-master:~$sudo /etc/init.d/sshd start
#在hadoop-master创建ssh-key
hadoop@hadoop-master:~$ssh-copy-id -i id_rsa.pub localhost
hadoop@hadoop-master:~$ssh-copy-id -i id_rsa.pub hadoop-slave1
hadoop@hadoop-master:~$ssh-copy-id -i id_rsa.pub hadoop-slave2

NOTE: 建议从master登录下hadoop-salve1和hadoop-salve2，因为电脑会出现安全认证 yes/no 以免下面的实现master无法同步slave

3) 安装jdk

点击(此处)折叠或打开

hadoop@hadoop-master:~$ sudo apt-get install default-jdk

NOTE:大概是170M左右的文件。龟速下载中（也可以用bin包，不过个人喜欢用apt..懒。）
配置/etc/profile

点击(此处)折叠或打开

export JAVA_HOME=/usr/lib/jvm/java-6-openjdk-amd64
export HADOOP_HOME=/home/hadoop/hadoop-1.0.2
export PATH=$PATH:$HADOOP_HOME/bin:$JAVA_HOME/bin
export HADOOP_HOME_WARN_SUPPRESS=1 #屏蔽hadoop的一个警告

4) 安装hadoop

点击(此处)折叠或打开

#下载hadoop-1.0.2
hadoop@hadoop-master:~$ wget -c http://archive.apache.org/dist/hadoop/core/hadoop-1.0.1/hadoop-1.0.2.tar.gz
#解压
hadoop@hadoop-master:~$tar xvzf hadoop-1.0.2.tar.gz
#软链接
hadoop@hadoop-master:~$ ln -s hadoop-1.0.2 hadoop

5) 配置hadoop
#conf/hadoop-env.sh

点击(此处)折叠或打开

#添加jdk
export JAVA_HOME=/usr/lib/jvm/java-6-openjdk-amd64

#conf/mapred-site.xml

点击(此处)折叠或打开

#hdfs-site.xm<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>hadoop-master:9001</value>
</property>
</configuration>

#conf/hdfs-site.xml

点击(此处)折叠或打开

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>dfs.name.dir</name>
<value>/home/hadoop/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/hadoop/data</value>
</property>
<property>
<name>dfs.replication</name>
<value>2</value> #默认是3份
</property>
</configuration>

#conf/core-site.xml

点击(此处)折叠或打开

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://hadoop-master:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/tmp</value>
</property>
</configuration>

#conf/master

点击(此处)折叠或打开

hadoop-master

#conf/slaves

点击(此处)折叠或打开

hadoop-slave1
hadoop-slave2

NOTE:创建name data目录不能预先创建，hadoop格式化会自动创建。

6) 拷贝 master的 hadoop目录到slave

点击(此处)折叠或打开

hadoop@hadoop-master:~$ scp -r hadoop hadoop-slave1:
hadoop@hadoop-master:~$ scp -r hadoop hadoop-slave2:

7) 格式化文件系统

点击(此处)折叠或打开

hadoop@hadoop-master:~$ cd hadoop-1.0.2/
hadoop@hadoop-master:~/hadoop-1.0.2$ bin/hadoop namenode -format
#sucess output
/************************************************************
SHUTDOWN_MSG: Shutting down NameNode atv-jiwan-ubuntu-0/127.0.0.1
*************************************************************

8) 启动所有结点

点击(此处)折叠或打开

hadoop@hadoop-master:~/hadoop-1.0.2$ bin/start-all.sh

9) 文件操作

点击(此处)折叠或打开

hadoop@hadoop-master:~$ hadoop dfs -mkdir os
hadoop@hadoop-master:~/hadoop-1.0.2$ bin/hadoop dfs -put bin/start-all.sh os
hadoop@hadoop-master:~/hadoop-1.0.2$ bin/hadoop dfs -ls os
drwxr-xr-x - hadoop supergroup 0 2012-05-08 11:38 /user/hadoop/os/start-all.sh

10)在slave上启动

点击(此处)折叠或打开

hadoop@hadoop-slave1:~/hadoop-1.0.2$ bin/start-dfs.sh #单独启动HDFS集群DataNode
hadoop@hadoop-slave1:~/hadoop-1.0.2$ bin/start-mapred.sh #单独启动Map/Reduce TaskTracker

11)关闭所有节点

点击(此处)折叠或打开

hadoop@hadoop-master:~/hadoop-1.0.2$ bin/stop-all.sh

阅读(758) | 评论(0) | 转发(0) |

上一篇：ubuntu 12.04（64位）下搭建了android2.3/android4.0开发环境

下一篇：OneStack：Ubuntu 12.04 (或11.10) 一键部署安装OpenStack云计算平台

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6