Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1210796
  • 博文数量: 259
  • 博客积分: 10
  • 博客等级: 民兵
  • 技术积分: 2518
  • 用 户 组: 普通用户
  • 注册时间: 2012-10-13 16:12
个人简介

科技改变世界,技术改变人生。

文章分类

全部博文(259)

分类: HADOOP

2015-08-06 17:58:10

添加节点

1.修改host
和普通的datanode一样。添加namenode的ip

2.修改namenode的配置文件conf/slaves
添加新增节点的ip或host

3.在新节点的机器上,启动服务
[root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start datanode
[root@slave-004 hadoop]# ./bin/hadoop-daemon.sh start tasktracker  

4.均衡block
[root@slave-004 hadoop]# ./bin/start-balancer.sh

1)如果不balance,那么cluster会把新的数据都存放在新的node上,这样会降低mapred的工作效率
2)设置平衡阈值,默认是10%,值越低各节点越平衡,但消耗时间也更长
[root@slave-004 hadoop]# ./bin/start-balancer.sh -threshold 5

3)设置balance的带宽,默认只有1M/s

   dfs.balance.bandwidthPerSec  
   1048576  
     
     Specifies the maximum amount of bandwidth that each datanode   
     can utilize for the balancing purpose in term of   
     the number of bytes per second.   
   
 

注意:
1. 必须确保slave的firewall已关闭;
2. 确保新的slave的ip已经添加到master及其他slaves的/etc/hosts中,反之也要将master及其他slave的ip添加到新的slave的/etc/hosts中


删除节点

1.集群配置
修改conf/hdfs-site.xml文件

   
   dfs.hosts.exclude  
   /data/soft/hadoop/conf/excludes  
   Names a file that contains a list of hosts that are   
   not permitted to connect to the namenode.  The full pathname of the   
   file must be specified.  If the value is empty, no hosts are   
   excluded.
 


2确定要下架的机器
dfs.hosts.exclude定义的文件内容为,每个需要下线的机器,一行一个。这个将阻止他们去连接Namenode。如:
slave-003  
slave-004 

3.强制重新加载配置
[root@master hadoop]# ./bin/hadoop dfsadmin  -refreshNodes  
查看nodemanage的
yarn rmadmin -refreshNodes
yarn node -list
它会在后台进行Block块的移动

4.关闭节点
等待刚刚的操作结束后,需要下架的机器就可以安全的关闭了。
[root@master hadoop]# ./bin/ hadoop dfsadmin -report  

可以查看到现在集群上连接的节点

正在执行Decommission,会显示:
Decommission Status : Decommission in progress  

执行完毕后,会显示:
Decommission Status : Decommissioned 

5.再次编辑excludes文件
一旦完成了机器下架,它们就可以从excludes文件移除了
登录要下架的机器,会发现DataNode进程没有了,但是TaskTracker依然存在,需要手工处理一下


阅读(1618) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~