Hadoop安装手册2-Hadoop环境配置-junsansi-ChinaUnix博客

junsansi的ChinaUnix博客

首页　| 　博文目录　| 　关于我

junsansi

博客访问： 1263252
博文数量： 350
博客积分： 10
博客等级：民兵
技术积分： 5668
用户组：普通用户
注册时间： 2011-03-23 17:53

文章分类

全部博文（350）

原创笔记（271）
Hadoop实践（8）
NOSQL（1）
mysql数据库（38）
mysql数据库（0）
涂抹ORACLE（32）
未分配的博文（0）

文章存档

2013年（350）

我的朋友

2、配置

2.1 配置参数

我们任选一个节点，比如说就hdnode1吧，使用grid用户登录，而后修改配置文件，详细如下。

配置hadoop的基础环境变量，如JDK位置，hadoop一些配置、文件及日志的路径，这些配置都在hadoop-env.sh文件中：

[grid@hdnode1 ~]$ vi /usr/local/hadoop-0.20.2/conf/hadoop-env.sh

这里我们先仅修改JAVA_HOME变量值，指定到JDK目录：

export JAVA_HOME=/usr/local/jdk1.7.0_09

提示，本步也可以不做修改，而将JAVA_HOME加到用户的环境变量中。

修改核心站点配置，主要指定NameNode服务器的地址：

[grid@hdnode1 ~]$ vi /usr/local/hadoop-0.20.2/conf/core-site.xml

修改内容如下：

fs.default.name

hdfs://hdnode1:9000/

true

这样我们就将hdnode1定义为NameNode。注意一个hadoop集群中不管master还是slave，fs.default.name的值必须相同，也就是说一个hadoop只能有一个NameNode。

指定HDFS相关的配置：

[grid@hdnode1 ~]$ vi /usr/local/hadoop-0.20.2/conf/hdfs-site.xml

修改内容如下：

dfs.name.dir

/data2/hadoop/name

true

dfs.data.dir

/data2/hadoop/data

true

dfs.replication

那么这几个参数又都是什么意思呢？别的咱不讲，说一说上文提到的这哥仨：

dfs.name.dir：指定namenode存储元数据的路径；
dfs.data.dir：指定datanode存储数据的路径；
dfs.replication：设置副本的数量，我们这里仨节点，设置再大没意义，就设置成3

除了这仨，别的参数还多着呢，后面咱们接触到了再介绍。

接下来配置mapreduce服务相关的参数，修改mapred-site.xml文件：

[grid@hdnode1 ~]$ vi /usr/local/hadoop-0.20.2/conf/mapred-site.xml

修改内容如下：

mapred.job.tracker

hdnode1:9001

true

指定JobTracker进程运行的位置，这里指定在hdnode1节点上执行。

指定运行SecondaryNameNode服务的节点：

[grid@hdnode1 ~]$ more /usr/local/hadoop-0.20.2/conf/masters

提示：注意哟，这里说的是运行SecondaryNameNode服务的节点，并不是指身份为master角色的节点哟。如果希望SecondaryNameNode运行在非namenode节点上的话，可以在这里指定另外的节点。

指定运行datanode和tasktracker的节点：

[grid@hdnode1 ~]$ more /usr/local/hadoop-0.20.2/conf/slaves

hdnode2

剩下的俩节点呗。

这样第一个节点就配置好了，第二和第三个节点怎么处理呢？直接将这些文件复制到第二第三节点即可。

阅读(2474) | 评论(0) | 转发(2) |

上一篇：MemSQL初体验 - (3)性能测试

下一篇：Hadoop安装手册3-启动Hadoop基础服务

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6