大型开源分布式监控工具Chukwa配置部署实践-fengzhanhai-ChinaUnix博客

海纳百川fengzhanhai.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

fengzhanhai

博客访问： 5610195
博文数量： 348
博客积分： 2173
博客等级：上尉
技术积分： 7901
用户组：普通用户
注册时间： 2011-08-24 17:26

个人简介

雄关漫道真如铁，而今迈步从头越。

文章分类

全部博文（348）

文章存档

2022年（4）

2020年（6）

2019年（2）

2018年（2）

2017年（34）

2016年（49）

2015年（53）

2014年（47）

2013年（72）

2012年（79）

我的朋友

相关博文

大型开源分布式监控工具Chukwa配置部署实践

分类： HADOOP

2015-05-27 11:58:10

Chukwa是Yahoo开发的一个开源的用于监控大型分布式系统的数据收集系统。它构建在hadoop的hdfs map/reduce框架之上，继承了hadoop的可伸缩性和鲁棒性。Chukwa还包含了一个强大和灵活的工具集，可用于展示、监控和分析已收集的数据。当我们在管理和维护超过100个节点的集群时如何实时有效、轻松的监控各个集群节点的健康状况及自身的相关信息呢？而Chukwa为我们提供了一种简单可行的方案。
所以下面我们具体讲解一下如何安装配置Chukwa分布式监控系统的方法与步骤。
一、先决条件
1.hadoop已经安装配置完成且运行正常
二、去官网上下载chukwa并解压到/home/chukwa路径下
##
##tar -zxvf chukwa-0.4.0.tar.gz
三、配置各个节点的环境变量vi .bash_profile：
export JAVA_HOME=/usr/java/jdk1.6.0_16
export JRE_HOME=/usr/java/jdk1.6.0_16/jre
export HADOOP_VERSION=0.20.2
export HADOOP_HOME=/home/hadoop/hadoop-${HADOOP_VERSION}
export CHUKWA_HOME="/home/chukwa/"
export ANT_HOME=/usr/ant/ant-1.7.0
export PATH=.:$PATH: $JAVA_HOME/bin:$HADOOP_HOME/bin:$CHUKWA_HOME/bin:$ANT_HOME/bin
export CLASSPATH=$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib:$ANT_HOME/lib:$HADOOP_HOME/hadoop-${HADOOP_VERSION}-core.jar:$HADOOP_HOME/lib/*:$HADOOP_HOME/lib/commons-logging-1.0.4.jar:$ANT_HOME/junit-3.8.1.jar:$HADOOP_HOME/ivy/ivy-2.0.0-rc2.jar:$HADOOP_HOME/lib/commons-logging-api-1.0.4.jar:$HADOOP_HOME/lib/log4j-1.2.15.jar:$HADOOP_HOME/lib/hadoop-lzo-0.4.8.jar
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib:/home/hadoop/hadoop-0.20.2/lib/native/Linux-amd64-64
export JAVA_LIBRARY_PATH=/home/hadoop/hadoop-0.20.2/lib/native/Linux-amd64-64
export javalibpath=/home/hadoop/hadoop-0.20.2/lib/native/Linux-amd64-64
四、配置$CHUKWA_HOME/conf/chukwa-env.sh文件
export JAVA_HOME=/usr/java/jdk1.6.0_16
export HADOOP_HOME="/home/hadoop/hadoop-0.20.2"
export HADOOP_CONF_DIR="/home/hadoop/hadoop-0.20.2/conf/"
export HADOOP_JAR=${HADOOP_HOME}/hadoop-0.20.2-core.jar
export chukwaRecordsRepository="/chukwa/repos/"
export CHUKWA_DATA_DIR="${CHUKWA_HOME}/data"
export CHUKWA_IDENT_STRING=chukwa
export JAVA_PLATFORM= Linux-amd64-64
export JAVA_LIBRARY_PATH=${HADOOP_HOME}/lib/native/${JAVA_PLATFORM}
export JDBC_DRIVER=com.mysql.jdbc.Driver
export JDBC_URL_PREFIX=jdbc:mysql://
export CHUKWA_HICC_MIN_iMEM=300M
export CHUKWA_HICC_MAX_MEM=300M
五、将必要的库从$CHUKWA_HOME/和$CHUKWA_HOME/lib拷贝到$HADOOP_HOME/lib
cp hukwa-agent-0.4.0.jar chukwa-hadoop-0.4.0-client.jar tools-0.4.0.jar,json.jar $HADOOP_HOME/lib
六、配置Agent
（1）配置$CHUKWA_HOME/conf/initial_adaptors
     cp initial_adaptors.template initial_adaptors
（2）配置$CHUKWA_HOME/conf/chukwa-agent-conf.xml

      chukwaAgent.tags
      cluster="fzhchukwa"
      The cluster's name for this agent

（3）配置$CHUKWA_HOME/conf/agents文件，我的配置如下所示：
     gd110
     gd111
     gd112
（4）配置$CHUKWA_HOME/conf/Collectors文件，我的配置如下：

（5）测试启动agents看每个节点上的agent否启动成功
     执行$CHUKWA_HOME/bin/ start-agents.sh
     此时应该会在各个节点上通过jps可以看到有一个进程叫做ChukwaAgent，
     可以试着telnet localhost 9093是否能够成功telnet
（6）关闭agents
     执行$CHUKWA_HOME/bin/stop-agents.sh,
（7）在关闭hadoop的状态下，将$CHUKWA_HOME/conf/hadoop-logs4j.properties覆盖
     $HADOOP_HOME/conf/log4j.properties
     修改$CHUKWA_HOME/conf/hadoop-metrics.properties中的TODO-CHUKWA_LOG_DIR修改为：/home/chukwa/logs/
     8.配置Collectors

七、配置$CHUKWA_HOME/conf/chukwa-collector-conf.xml文件，我的配置如下：

    writer.hdfs.filesystem
    hdfs://gd115:9989/
    HDFS to dump to

##此处配置的信息应该和$HADOOP_HOME/conf/core-site.xml当中的fs.default.name内容一致，因为collectors需要将从agents收集到的信息存储到hdfs上面去

    chukwaCollector.outputDir
    /chukwa/logs/
    Chukwa data sink directory

    chukwaCollector.http.port
    9927
    The HTTP port number the collector will listen on

##这个地方的端口号要和collectors文件当中的保持一致
（2）测试collectors，agents，hadoop
先启动hadoop，在动collectors，最后启动agent，命令如下：
$HADOOP_HOME/bin/start-all.sh
$CHUKWA_HOME/bin/start-collectors.sh
$CHUKWA_HOME/bin/start-agents.sh
检查一下内容，确认chukwa正常启动：
（a）通过jps看是否有相应的节点上是否有相应的进程，其中agent进程对应ChukwaAgent，collector进程对应CollectorStub
（b）查看$CHUKWA_HOME/logs/agent.log及$CHUKWA_HOME/logs/collector.log,看他们是否正常
（c）通过网络web访问查看是否显示正常，结合我之前的配置，检查collector时网址中输入可以看到显示：”Chukwa servlet running”，若检查agent，在网址中输入
（d）查看hdfs上是否生成了相应的文件$HADOOP_HOME/bin/hadoop dfs -ls /理论上应该hdfs上会有/chukwa/logs目录生成
八、配置Demux
（1）运行processor
    $CHUKWA_HOME/bin/start-data-processors.sh
##开始运行后的直接效果是jps多出3个进程，分别是PostProcessorManager,ChukwaArchiveManager,Demuxmanager
##同时通过查看hdfs，可以发现/chukwa/目录下多了好几目录,分别是/chukwa/archivesProcessing, /chukwa/dataSinkArchives,/chukwa/demuxProcessing,随着时间的增加，数据分析进行的深入，会在hdfs上##的/chukwa/目录下生成更多的目录，最终目录结构同http://incubator.apache.org/chukwa/docs/r0.4.0/dataflow.html
九、配置数据库
Chukwa0.4.0是通过将分析好的数据从hdfs上转储到mysql数据库中，然后通过hicc命令来进行图形化显示的，而对于chukwa0.5.0是通过hbase而非本地的mysql来处理的，所以对于chukwa0.4.0，我们还得装mysql数据库这里我把MySQL安装在了和Demux同一个节点之上，同理HICC也是运行在这个节点之上的
（1）从mysql官网上下载mysql
http://dev.mysql.com/downloads/mysql/5.1.html
（2）将该文件解压到$CHUKWA_HOME/opt/目录下，后面我用$MYSQL_HOME代表mysql所在目录
（3）我给系统添加一个mysql用户:useradd mysql
（4）安装MySQL数据库
     cd $MYSQL_HOME
     ./scripts/mysql_install_db
     ./bin/mysqld_safe &
     ./bin/mysqladmin –u root create zlhchukwa
     ./bin/mysql –u root zlhchukwa<$CHUKWA_HOME/conf/database_cerate_tables.sql
##进入到数据库当中检查是否在数据库当中建了一个叫做的zlhchukwa的database，并且在该database当中是否产生了一些tables
（5）配置$CHUKWA_HOME/conf/jdbc.conf文件，
   =jdbc:mysql://localhost:3306/?user=root
    fzhchukwa=jdbc:mysql://localhost:3306/zlhchukwa?user=root
（6）启动进程将数据从hdfs下载到数据库
在装有数据库的那个非namenode节点上，运行$CHUKWA_HOME/bin/dbAdmin.sh
##在chukwa0.4.0当中是没有这个脚本的，我是从chukwa0.3.0的bin目录上面弄过来的
十、运行hicc进行图形化查看
      $CHUKWA_HOME/bin/chukwa hicc

阅读(4381) | 评论(0) | 转发(0) |

上一篇：使用LOAD工具导致DB2进入备份暂挂、复原暂挂、装入暂挂及完整性暂挂问题的解决方法

下一篇：DB2和Oracle区别

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6