Chinaunix首页 | 论坛 | 博客
  • 博客访问: 329195
  • 博文数量: 49
  • 博客积分: 653
  • 博客等级: 上士
  • 技术积分: 646
  • 用 户 组: 普通用户
  • 注册时间: 2011-06-01 22:43
文章分类

全部博文(49)

文章存档

2018年(1)

2017年(4)

2015年(1)

2014年(6)

2013年(8)

2012年(24)

2011年(5)

分类: LINUX

2014-11-04 19:59:01


昨天晚上EMR 节点挂掉3台,今天中午又LOST了6台, 本来就二三十台的小集群,LOST了三分之一的机器
处理方法:
1  EMR  namenode 和datanode节点 之间没有做免登陆的配置
 ssh的时候必须带私钥
 如:
  
   ssh -i ~/XXX.pem   username@ip  
    登陆到datanode 节点重启datanode节点即可
2 启动datanode节点
 
./sbin/hadoop-daemon.sh  stop  datanode
./sbin/hadoop-daemon.sh  start datanode
./sbin/
yarn-daemon.sh start nodemanager

3 LOST突然丢失这么多,在集群压力还是很小的情况下,还是比较意外的。
看样子还得加相关的监控,不能太相信云服务的可靠性。


阅读(1387) | 评论(0) | 转发(0) |
0

上一篇:linux signal 信号函数 浅析

下一篇:vim配置

给主人留下些什么吧!~~