Chinaunix首页 | 论坛 | 博客
  • 博客访问: 7172739
  • 博文数量: 3857
  • 博客积分: 6409
  • 博客等级: 准将
  • 技术积分: 15948
  • 用 户 组: 普通用户
  • 注册时间: 2008-09-02 16:48
个人简介

迷彩 潜伏 隐蔽 伪装

文章分类

全部博文(3857)

文章存档

2017年(5)

2016年(63)

2015年(927)

2014年(677)

2013年(807)

2012年(1241)

2011年(67)

2010年(7)

2009年(36)

2008年(28)

分类: HADOOP

2013-12-06 10:38:30

     腾出手来对部署好的hadoop/hbase进行分析测试,但是运行过程中经常会不时地node2无法正常启动HRegionserver,从而导致整个平台的计算受到影响。之前自己围绕HMaster自动关闭的问题,删除了各个节点的HDFS目录,重新格式化后问题得到了解决,但是这次问题却依旧,于是自己只好去日志中一探究竟了:
     
     注意其中的关键语句:Time difference of 37857 ms > max allowed of 30000 ms,原来是时间戳导致的各个节点间间隔时间太长导致的启动问题。那么解决问题的思路就清晰了:
1. 修改默认的30000ms:可以直接去各个节点的hbase的conf中的default-site.xml中修改30000-->60000 ms,这种方法应当有效,但是自己的机器上实验之后却问题依旧,至今不明白什么原因,所以自己只好采取了另外一种方法:
2. 修改Ubuntu的系统时间:这里要对各个节点的时间进行重新同步,当然由于是内网,不可能和服务器同步,只有自己来设置命令了,也很简单:
--> sudo date -s 15:23:00
--> sudo /etc/init.d/hwclock restart
   运行命令的时候统一以master作为标准,node1和node2控制在master的时间范围之内,设置的时候稍微注意就可以了。

     然后可以看到重新启动各个节点,运行hadoop-->ZK-->hbase,服务正常启动,问题解决!
PS:
     这里的问题自己之前也遇到过,但是自己之前就是简单地按照HMaster自动关闭的方法来解决,有时候碰巧时间差小也能凑合过去,但是终究不是常法;分析完日志,确定是时间差问题后,同事细心地发现每台机器的系统时间不一致,而且相差较大,这才使得我们注意到了时间戳的问题,细心地观察,确定解决问题的思路,这这点需要好好向同事学习。
阅读(676) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~