hadoop环境搭建-Larpenteur-ChinaUnix博客

尘世中一个迷途小书童riverhwp.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

Larpenteur

博客访问： 6422944
博文数量： 2759
博客积分： 1021
博客等级：中士
技术积分： 4091
用户组：普通用户
注册时间： 2012-03-11 14:14

文章分类

全部博文（2759）

Todo（1）
Advice（151）
Linux-未分类（223）
Ubuntu（47）
Database（145）
算法&DS（77）
Android（47）
Web（214）
Geek（237）
CPPC（296）
Java（113）
Python（99）
Matlab（19）
Git（19）
SVN（11）
Gnuplot（5）
面试（0）
机器-挖掘-AI（6）
开源项目（1）
Happy Drawe（9）
Programming（144）

Tools（23）

Shell（66）

Makefile（11）

GDB（26）

vim（18）
System（628）

Author（110）

Common（4）

Memory（66）

File system（82）

Driver（19）

IO（66）

Storage（45）

General（38）

Architecture（19）

Command（64）

Kernel（115）
Virtualization（39）
Cloud（33）
Hadoop（71）
Big Data（24）
未分配的博文（100）

文章存档

2019年（1）

2017年（84）

2016年（196）

2015年（204）

2014年（636）

2013年（1176）

2012年（463）

我的朋友

相关博文

hadoop环境搭建

分类：云计算

2013-07-16 02:33:02

原文地址：hadoop环境搭建作者：hbjxzl

新搭建的hadoop环境,使用起来还不错
1、修改主机信息
每个node节点需要修改/etc/hosts文件
192.168.1.xxx master
192.168.1.xxx node1
192.168.1.xxx node2
2、修改自动登录设置
每个节点均操作
  ssh-keygen -t rsa
  将生成的id_rsa.pub密码信息输入到authorized_keys
将所有节点的authorized_keys合并到一个文件中,然后把合并之后的文件覆盖到每个节点的.ssh目录下
每个节点赋予权限
chmod 644 ~/.ssh/authorized_keys
3、关闭防火墙
     各机器加入iptables策略：
  [master-/root]iptables -I INPUT -s 192.168.1.0/255.255.255.0 -j ACCPET
  [master-/root]service iptables save
4、安装jdk
每个节点均操作，仅支持JDK1.6之上的版本
1、解压jdk文件，并且设置java_home和path环境变量
2、修改环境变量
   编辑三台机器的/etc/profile,增加如下内容
   export JAVA_HOME=/hadoop/jdk
   export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
   export HADOOP_HOME=/hadoop/hadoop
   export HBASE_HOME=/hadoop/hbase
   PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HBASE_HOME/bin
  [master-/hadoop]vi /hadoop/.bashrc
  增加
  export HADOOP_CONF_DIR=/hadoop/hadoop-config
  export HBASE_CONF_DIR=/hadoop/hbase-config
5、安装hadoop
    下载hadoop tar包
  [master-/hadoop]tar -zxvf hadoop-0.20.2.tar.gz
  [master-/hadoop]ln -s hadoop-0.20.2 hadoop
  由于上述目录中hadoop的配置文件和hadoop的安装目录是放在一起的，这样一旦日后升级hadoop版本的时候所有的配置文件都会被覆盖，因此将配置文件与安装目录分离，一种比较好的方法就是建立一个存放配置文件的目录，/hadoop/hadoop-config/，然后将 /hadoop/hadoop/conf/目录中的core-site.xml,slaves,hadoop-env.sh,masters, hdfs-site.xml,mapred-site.xml，这6个文件拷贝到 /hadoop/hadoop-config/目录中，并指定环境变量$HADOOP_CONF_DIR指向该目录。环境变量在/root/.bashrc 中设定。
  [master-/hadoop]mkdir /hadoop/hadoop-config
  [master-/hadoop]cd /hadoop/hadoop/conf/
  [master-/hadoop]cp core-site.xml slaves hadoop-env.sh masters hdfs-site.xml mapred-site.xml /hadoop/hadoop-config
6、修改hadoop环境变量
    masters:
  master

  slaves:
  slave1
  slave2

  #切忌不要创建：/hadoop/hadoop/tmp
  hadoop-env.sh:
  export JAVA_HOME=/hadoop/jdk
  export HADOOP_PID_DIR=/hadoop/hadoop/tmp

  core-site.xml:





     fs.default.name
     hdfs://master:54310



  #切忌不要创建：/hadoop/hadoop/name
  [master-/hadoop]mkdir /hadoop/hadoop/data
  hdfs-site.xml:





   dfs.name.dir
   /hadoop/hadoop/name/ #hadoop的name目录路径


   dfs.data.dir
   /hadoop/hadoop/data/ #hadoop的data目录路径


      dfs.replication
      3     #指定 HDFS 中每个 Block 被复制的次数，起数据冗余备份的作用。在典型的生产系统中，这个数常常设置为3



  mapred-site.xml:





      mapred.job.tracker
      hdfs://master:54311/

  3、格式化namenode
  [master-/hadoop]cd /hadoop/hadoop/bin
  [master-/hadoop]./hadoop namenode -format
  [master-/hadoop]cd /hadoop
  [master-/hadoop]scp -r ./*
  [master-/hadoop]scp -r ./*
  到slave1和slave2上,分别重做软链接
  [master-/hadoop]cd /hadoop
  [master-/hadoop]rm -rf hadoop
  [master-/hadoop]ln -s hadoop-0.20.2 hadoop

  4、启动所有hadoop守护进程
    [master-/hadoop/hadoop/bin]./start-all.sh
    说明：
    在bin/下面有很多启动脚本，可以根据自己的需要来启动。
    * start-all.sh 启动所有的Hadoop守护。包括namenode, datanode, jobtracker, tasktrack
    * stop-all.sh 停止所有的Hadoop
    * start-mapred.sh 启动Map/Reduce守护。包括Jobtracker和Tasktrack
    * stop-mapred.sh 停止Map/Reduce守护
    * start-dfs.sh 启动Hadoop DFS守护.Namenode和Datanode
    * stop-dfs.sh 停止DFS守护
    [root@master bin]# jps
    6813 NameNode
    7278 Jps
    7164 JobTracker
    7047 SecondaryNameNode
    出现4个这样的进程，且datanode没有error，同时访问ui正常才算成功。
    ui： --web UI for HDFS name node(s)
        --web UI for MapReduce job tracker(s)
           --web UI for task tracker(s)

  5、hdfs简单测试
  [master-/hadoop/hadoop/bin]./hadoop dfs -mkdir testdir
  [master-/hadoop/hadoop/bin]./hadoop dfs -put /root/install.log testdir/install.log-dfs
  将/root/install.log 存储到hdfs中的testdir中，重命名为install.log-dfs
  [master-/hadoop/hadoop/bin]./hadoop dfs -ls
  [master-/hadoop/hadoop/bin]./hadoop dfs -ls testdir

阅读(590) | 评论(0) | 转发(0) |

上一篇：linux下调整进程优先级

下一篇：Malloc最多一次能分配多少内存

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6