Chinaunix首页 | 论坛 | 博客
  • 博客访问: 319333
  • 博文数量: 65
  • 博客积分: 2570
  • 博客等级: 少校
  • 技术积分: 730
  • 用 户 组: 普通用户
  • 注册时间: 2008-08-15 14:04
个人简介

苦逼房奴一枚

文章分类

全部博文(65)

文章存档

2017年(19)

2016年(5)

2013年(6)

2012年(1)

2011年(3)

2009年(5)

2008年(26)

我的朋友

分类: 大数据

2013-08-07 10:16:05

说到对Hadoop和HBase的集群监控,大家知道的和用的最多的可能还是第三方的监控工具,cacti,ganglia,zabbix之类的。玩的深一些的,会用zenoss之类的。这些工具确实不错,也能发挥很大的作用,但时间长了总感觉监控粒度还是比较粗,不够详细。毕竟是第三方的监控,即便Hadoop自带了ganglia的接口,也还是觉得不够。其实Hadoop本身是带有监控接口的,各公司的发行版还有自己定制的接口,不过可能知道的人就不太多了。这个不详细的看文档和源码一般是找不到的,属于隐藏属性。事实上,我写的EasyHadoop管理界面里面就用到了这个监控的接口,能够对整个集群有一个比较详细的状态监控,目前还在不断扩展。下一步会实现对Java进程的Heap使用的监控,这样对整个集群的性能调优就会起到比较重要作用。其实这个接口特别简单,但是非常详细,也非常方便,就是JMX。
Hadoop的http监控端口基本所有人都知道,namenode 50070,jobtracker 50030,datanode 50075,tasktracker 50060。不过当用户访问这些端口的时候,会自动跳转到dfshealth.jsp或者jobtracker.jsp这样的监控页面。jmx的访问很简单,只需要把网页的名字换成jmx就可以了。

例如

的地址替换成即可,其他如50030,50060等等,也依次类推,HBase的系统信息也可以用这种方法获取。
返回值全部是JSON,非常便于自己进行处理。返回的信息也非常详细,内存状态,内存池状态,java堆信息等等。甚至还有操作系统信息,版本,JVM版本信息等等,很全面。
但是这个接口获取的JSON往往很大,而且对于某一项的监控,整个抓一串JSON信息就太浪费了。所以,这又是一个隐藏属性了,只在Hadoop源码中可以了解到。源码在src/core/org/apache/hadoop/jmx中。
JMXJsonServlet.java的一个public类


点击(此处)折叠或打开

  1. public void doGet(HttpServletRequest
  2.  request, HttpServletResponse response) {
  3.   try {
  4.     //
  5.  Do the authorization
  6.     if (!HttpServer.hasAdministratorAccess(getServletContext(),
  7.  request,
  8.         response))
  9.  {
  10.       return;
  11.     }
  12.     response.setContentType("application/json;
  13.  charset=utf8");
  14.     PrintWriter
  15.  writer = response.getWriter();
  16.     JsonFactory
  17.  jsonFactory = new JsonFactory();
  18.     JsonGenerator
  19.  jg = jsonFactory.createJsonGenerator(writer);
  20.     jg.useDefaultPrettyPrinter();
  21.     jg.writeStartObject();
  22.     if (mBeanServer
  23.  == null)
  24.  {
  25.       jg.writeStringField("result", "ERROR");
  26.       jg.writeStringField("message", "No
  27.  MBeanServer could be found");
  28.       jg.close();
  29.       return;
  30.     }
  31.     String
  32.  qry = request.getParameter("qry");
  33.     if (qry
  34.  == null)
  35.  {
  36.       qry
  37.  = "*:*";
  38.     }
  39.     listBeans(jg, new ObjectName(qry));
  40.     jg.close();
  41.   } catch (IOException
  42.  e) {
  43.     LOG.error("Caught
  44.  an exception while processing JMX request",
  45.  e);
  46.     response.setStatus(HttpServletResponse.SC_INTERNAL_SERVER_ERROR);
  47.   } catch (MalformedObjectNameException
  48.  e) {
  49.     LOG.error("Caught
  50.  an exception while processing JMX request",
  51.  e);
  52.     response.setStatus(HttpServletResponse.SC_BAD_REQUEST);
  53.   }
  54. }


从源码中可以看到json的获取可以带有http验证,另外还可以有一个参数叫qry。这个参数的值就是在获取整个长JSON中每个"name"key所对应的名字。也就是,可以用
MarkSweep
这种方式来获取关于JVM对内存垃圾回收的处理状态信息。很简单不是吗?
在EasyHadoop的Agent中获取HDFS和MR的实时状态监控就是通过JMX的接口,处理代码如下:


点击(此处)折叠或打开

  1. class EasyHadoopHandler:
  2.     def GetJmx(self,host,port,qry):
  3.         url = 'http://'+host+':'+port+'/jmx?qry='+qry
  4.         jmx = urllib.urlopen(url)
  5.         json = jmx.read().replace('\n','')
  6.         jmx.close()
  7.         return json


由Central主动发起查询JMX的请求,Agent在获取了相关的监控信息后将json返回给Central,Central再用js将数据进行绘图实时返回给用户。
各发行版还有不同的监控接口,例如cloudera版还多加了一个叫metrics也不metrics2的接口。
这样来自己做Hadoop的监控,就比光使用cacti和ganglia就详细了许多。HBase也可对60010等端口进行同样的处理,进行监控。

阅读(3920) | 评论(0) | 转发(0) |
0

上一篇:hadoop jconsole监控

下一篇:Hadoop的Slots概念

给主人留下些什么吧!~~