Chinaunix首页 | 论坛 | 博客
  • 博客访问: 262298
  • 博文数量: 147
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 1149
  • 用 户 组: 普通用户
  • 注册时间: 2014-01-14 16:47
个人简介

路漫漫其修远兮,吾将上下而求索

文章分类

全部博文(147)

文章存档

2018年(1)

2016年(10)

2015年(15)

2014年(121)

我的朋友

分类: 系统运维

2016-07-05 16:54:51

下面就介绍一下使用omsa来监控dell服务器的硬件信息。

点击(此处)折叠或打开

  1. 目前我监控以下的硬件信息:
  2. 1、cpu处理器状态
  3. 2、cpu省电模式状态(如果开启了省电模式,在压力大的时候,会很卡的)
  4. 3、raid状态(比如做了哪个raid模式,raid状态是否正常)
  5. 4、内存状态(可以查看当前服务器最大支持多少内存,当前多少内存,如果内存有问题,可以显示哪个位置内存故障)
  6. 5、机器温度状态(监控机器的温度是否超过阀值)
  7. 6、物理硬盘状态(监控物理硬盘是否有故障)
  8. 7、电源状态(是单电还是双电,是否有故障)
  9. 8、系统面板CMOS电池(cmos电池是否有故障)
  10. 9、网卡状态(当前的网卡数量,以及网卡是否有问题)
  11. 10、风扇(当前的风扇数量,以及是否有故障)
  12. 默认是cpu省电模式监控关闭报警,其他的监控都是15分钟监控一次,如果连续2次都有问题则报警通知。
  13. 下面是监控图
1、硬件正常的服务器监控截图

一、客户端
A.在redhat或者centos系统里安装

1、安装dell的yum源

点击(此处)折叠或打开

  1. wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
2、安装omsa

点击(此处)折叠或打开

  1. yum install srvadmin-all
3、做软连接

点击(此处)折叠或打开

  1. ln -s /opt/dell/srvadmin/sbin/omreport /usr/bin/omreport
  2. ln -s /opt/dell/srvadmin/sbin/omconfig /usr/bin/omconfig
4、关闭web模式(仅允许运行cli)

点击(此处)折叠或打开

  1. echo "/usr/bin/omconfig system webserver action=stop" >>/opt/dell/srvadmin/sbin/srvadmin-services.sh
5、启动omsa

点击(此处)折叠或打开

  1. /opt/dell/srvadmin/sbin/srvadmin-services.sh start
6、把omsa加入到开机启动里

点击(此处)折叠或打开

  1. echo "/opt/dell/srvadmin/sbin/srvadmin-services.sh start">>/etc/rc.local

以上是在centos或者redhat系统里安装omsa。

B.下面是在ubuntu下的安装

1、增加源

点击(此处)折叠或打开

  1. echo 'deb http://linux.dell.com/repo/community/ubuntu precise openmanage' | sudo tee -a /etc/apt/sources.list.d/linux.dell.com.sources.list
2、检测与增加key

点击(此处)折叠或打开

  1. gpg --keyserver pool.sks-keyservers.net --recv-key 1285491434D8786F
  2. gpg -a --export 1285491434D8786F | sudo apt-key add -
3、更新源

点击(此处)折叠或打开

  1. apt-get update -y
4、安装omsa

点击(此处)折叠或打开

  1. apt-get install srvadmin-all -y
5、做软连接

点击(此处)折叠或打开

  1. ln -s /opt/dell/srvadmin/sbin/omreport /usr/bin/omreport
  2. ln -s /opt/dell/srvadmin/sbin/omconfig /usr/bin/omconfig
6、启动cli模式omsa

点击(此处)折叠或打开

  1. service dataeng start

C.zabbix客户端的配置

1、下面是在zabbix_agentd.conf里配置


点击(此处)折叠或打开

  1. #follow is monitor hardware
  2. UserParameter=hardware_battery,omreport chassis batteries|awk '/^Status/{if($NF=="Ok") {print 1} else {print 0}}'
  3. UserParameter=hardware_cpu_model,awk -v hardware_cpu_crontol=`sudo omreport chassis biossetup|awk '/C State/{if($NF=="Enabled") {print 0} else {print 1}}'` -v hardware_cpu_c1=`sudo omreport chassis biossetup|awk '/C1[-|E]/{if($NF=="Enabled") {print 0} else {print 1}}'` 'BEGIN{if(hardware_cpu_crontol==0 && hardware_cpu_c1==0) {print 0} else {print 1}}'
  4. UserParameter=hardware_fan_health,awk -v hardware_fan_number=`omreport chassis fans|grep -c "^Index"` -v hardware_fan=`omreport chassis fans|awk '/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_fan_number==hardware_fan) {print 1} else {print 0}}'
  5. UserParameter=hardware_memory_health,awk -v hardware_memory=`omreport chassis memory|awk '/^Health/{print $NF}'` 'BEGIN{if(hardware_memory=="Ok") {print 1} else {print 0}}'
  6. UserParameter=hardware_nic_health,awk -v hardware_nic_number=`omreport chassis nics |grep -c "Interface Name"` -v hardware_nic=`omreport chassis nics |awk '/^Connection Status/{print $NF}'|wc -l` 'BEGIN{if(hardware_nic_number==hardware_nic) {print 1} else {print 0}}'
  7. UserParameter=hardware_cpu,omreport chassis processors|awk '/^Health/{if($NF=="Ok") {print 1} else {print 0}}'
  8. UserParameter=hardware_power_health,awk -v hardware_power_number=`omreport chassis pwrsupplies|grep -c "Index"` -v hardware_power=`omreport chassis pwrsupplies|awk '/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_power_number==hardware_power) {print 1} else {print 0}}'
  9. UserParameter=hardware_temp,omreport chassis temps|awk '/^Status/{if($NF=="Ok") {print 1} else {print 0}}'|head -n 1
  10. UserParameter=hardware_physics_health,awk -v hardware_physics_disk_number=`omreport storage pdisk controller=0|grep-c "^ID"` -v hardware_physics_disk=`omreport storage pdisk controller=0|awk '/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_physics_disk_number==hardware_physics_disk) {print 1} else {print 0}}'
  11. UserParameter=hardware_virtual_health,awk -v hardware_virtual_disk_number=`omreport storage vdisk controller=0|grep -c "^ID"` -v hardware_virtual_disk=`omreport storage vdisk controller=0|awk '/^Status/{if($NF=="Ok") count+=1}END{print count}'` 'BEGIN{if(hardware_virtual_disk_number==hardware_virtual_disk) {print 1} else {print 0}}'

2、重启zabbix_agentd服务

点击(此处)折叠或打开

  1. ps -ef|grep zabbix|grep -v grep|awk '{print $2}'|xargs kill -9
  2. /usr/local/zabbix/sbin/zabbix_agentd -c /usr/local/zabbix/conf/zabbix_agentd.conf

二、服务端

1、模板导入

把Template Hardware Monitor导入到zabbix里(模板在附件),具体操作不介绍。

2、主机关联模板

把需要监控的硬件服务器关联此模板即可


DELL.zip
阅读(472) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~
评论热议
请登录后评论。

登录 注册