Chinaunix首页 | 论坛 | 博客
  • 博客访问: 117497
  • 博文数量: 15
  • 博客积分: 1441
  • 博客等级: 上尉
  • 技术积分: 165
  • 用 户 组: 普通用户
  • 注册时间: 2006-04-30 10:17
文章分类

全部博文(15)

文章存档

2010年(2)

2009年(3)

2008年(1)

2007年(9)

我的朋友

分类: LINUX

2007-03-29 12:56:13

[标签]: Linux
[说明]:试验mrtg的扩展性能。虽然现在有rrdtools、Nagios等等多种监控工具,Camor还是觉得mrtg最简单直观:)
 
# camor原创并首发于http://camor.cublog.cn
# 转载和引用请先留言并注明出处!
# [By camornow$gmail.com]


----------------------------
1) 安装所需rpm包
----------------------------
net-snmp-perl-5.1.2-11.EL4.6.x86_64.rpm
net-snmp-libs-5.1.2-11.EL4.6.x86_64.rpm
net-snmp-utils-5.1.2-11.EL4.6.x86_64.rpm
net-snmp-devel-5.1.2-11.EL4.6.x86_64.rpm
   !!需要预先安装以下rpm包
   beecrypt-devel-3.1.0-6.x86_64.rpm
   elfutils-devel-0.97-5.x86_64.rpm(在第5张安装光盘上)
net-snmp-5.1.2-11.EL4.6.x86_64.rpm
net-snmp-utils-5.1.2-11.EL4.6.x86_64.rpm
安装mrtg-2.10.15-1.x86_64.rpm

 
 
----------------------------
2) 修改/etc/snmp/snmpd.conf
----------------------------
找到这行:
# Make at least  snmpwalk -v 1 localhost -c public system fast again
#       name           incl/excl     subtree         mask(optional)
view    systemview    included   .1.3.6.1.2.1.1
view    systemview    included   .1.3.6.1.2.1.25.1.1
在view几行的下面,加上这段文字:
# For Mrtg Add start ####################################
view    all           included   .1.3.6
# For Mrtg Add end   ####################################
找到这行:
####
# Finally, grant the group read-only access to the systemview view.
#       group          context sec.model sec.level prefix read   write  notif
access  notConfigGroup ""      any       noauth    exact  mib2   none   none
把 access  notConfigGroup 里的mib2(也可能是systemview) 更改为all
如果需要监控硬盘容量使用状况,还需要进行以下操作:
用 df -a 看到你要监控的硬盘分卷方式以及容量大小(-am:以M为单位; -ak:以K为单位 -ag:以G为单位)
比如:
#df -am
Filesystem            容量  已用 可用 已用% 挂载点
/dev/sda2                 9845      5695      3650  61% /
/dev/sda6                45168     24761     18113  58% /Datas
然后修改/etc/snmp/snmpd.conf,在刚才修改的view行最下面加入:
disk / 9845
disk /Datas 45168
然后重启snmp服务
# service snmpd restart

----------------------------
3) 修改mrtg配置文件 mrtg.cfg
----------------------------
使用Redhat AS4u2 自带的 安装 mrtg-2.10.15-1.x86_64.rpm
安装以后的配置文件是/etc/mrtg/mrtg.cfg

我们预设要监控的服务器以下参数:
连接公网网卡的流量;
主机连续运行时间;
系统负载;
CPU负载;
内存使用量;
系统进程数;
硬盘空间;
打开的TCP连接数。

我的mrtg.cfg配置如下:
# Camor's Minimal mrtg.cfg
#--------------------
EnableIPv6: no
WorkDir: /var/www/mrtg
Language: gb2312
HtmlDir: /var/www/mrtg
ImageDir: /var/www/mrtg
LogDir: /var/log/mrtg
ThreshDir: /var/lib/mrtg
LoadMIBs:/usr/share/snmp/mibs/UCD-SNMP-MIB.txt,/usr/share/snmp/mibs/HOST-RESOURCES-MIB.txt,/usr/share/snmp/mibs/TCP-MIB.txt
#================================================================================
#监控eth1网卡(连接公网的)
#================================================================================
Target[eth1_lan]: /192.168.1.68:public@localhost:
Options[eth1_lan]: growright
Directory[eth1_lan]: eth1
MaxBytes[eth1_lan]: 100000000
Kmg[eth1_lan]: ,k,M,G,T,P
YLegend[eth1_lan]: Bytes per Second
ShortLegend[eth1_lan]: B/s
Legend1[eth1_lan]: 每秒流入量 (单位 Bytes)
Legend2[eth1_lan]: 每秒流出量 (单位 Bytes)
LegendI[eth1_lan]: 流入:
LegendO[eth1_lan]: 流出:
Title[eth1_lan]: eth1网络流量[流入+流出]
PageTop[eth1_lan]:

eth1网络流量[流入+流出]


 
 
 
 
 
 
 
 
系统 :System02
描述 :LAN网络接口eth1的网络流量(Bytes/s)
位置 : 办公服务器68
最大值:100 MBytes/s
管理员:user@123.com
说明 :eth1 ip=192.168.1.68

#================================================================================
#监控主机连续运行时间[运行天数]
#================================================================================
Target[upday]: `/etc/mrtg/bin/mrtg-updays.pl`
Options[upday]: gauge,nopercent,growright
Directory[upday]: upday
MaxBytes[upday]: 1000
YLegend[upday]: Up Days
ShortLegend[upday]: 天
Legend1[upday]: 主机连续运行时间(天)
Legend2[upday]:
LegendI[upday]: 运行时间:
LegendO[upday]:
Title[upday]: 主机连续运行时间[运行天数]
PageTop[upday]:

主机连续运行时间[运行天数]


 
 
 
 
 
 
 
系统:system02
描述:主机连续运行的时间(天)
位置:办公服务器68
最大值:1000天
管理员:user@123.com

#================================================================================
#监控系统负载[1分钟+15分钟]
#================================================================================
Target[systemload]: .1.3.6.1.4.1.2021.10.1.5.1&.1.3.6.1.4.1.2021.10.1.5.3:public@localhost:
Options[systemload]: gauge,nopercent,growright
Directory[systemload]: load
MaxBytes[systemload]: 3000
YLegend[systemload]: System Load
ShortLegend[systemload]:
Legend1[systemload]: 最近1分钟系统负载(x100)
Legend2[systemload]: 最近15分钟系统负载(x100)
LegendI[systemload]: 1分钟负载:
LegendO[systemload]: 15分钟负载:
Title[systemload]: 系统负载(x100)[1分钟+15分钟]
PageTop[systemload]:

系统负载(x100)[1分钟+15分钟]


 
 
 
 
 
 
 
系统:system02
描述:系统负载(x100)[1分钟+15分钟]
位置:办公服务器68
最大值:30(x100)
管理员:user@123.com

#================================================================================
#监控CPU负载[用户+闲置]
#================================================================================
Target[cpuload]: .1.3.6.1.4.1.2021.11.50.0&1.3.6.1.4.1.2021.11.53.0:public@localhost:
Options[cpuload]: nopercent,growright
Directory[cpuload]: cpu
MaxBytes[cpuload]: 100
Unscaled[cpuload]: dwym
YLegend[cpuload]: CPU Utilization
ShortLegend[cpuload]: %;
Legend1[cpuload]: CPU用户负载(%)
Legend2[cpuload]: CPU闲置(%)
LegendI[cpuload]: 用户:
LegendO[cpuload]: 闲置:
Title[cpuload]: CPU负载[用户+闲置]
PageTop[cpuload]:

CPU负载[用户+闲置]


 
 
 
 
 
 
 
系统:system02
描述:CPU负载[用户+闲置]
位置:办公服务器68
最大值:100
管理员:user@123.com

#================================================================================
#监控内存使用量[Mem+Swap]
#================================================================================
Target[memory]: .1.3.6.1.2.1.25.2.3.1.6.2&.1.3.6.1.2.1.25.2.3.1.6.3:public@localhost:
Options[memory]: gauge,growright
Directory[memory]: mem
MaxBytes1[memory]: 4045336
MaxBytes2[memory]: 2097152
Kmg[memory]: k,M,G,T,P
Kilo[memory]: 1024
Unscaled[memory]: dwym
YLegend[memory]: Bytes
ShortLegend[memory]: B
Legend1[memory]: 已用Mem (Bytes)
Legend2[memory]: 已用Swap(Bytes)
LegendI[memory]: 已用Mem :
LegendO[memory]: 已用Swap:
Title[memory]: 内存使用量[Mem+Swap]
PageTop[memory]:

内存使用量[Mem+Swap]


 
 
 
 
 
 
 
系统:system02
描述:Memory和Swap的使用量(Bytes)
位置:办公服务器68
最大值:Mem=4096M,Swap=2048M
管理员:user@123.com

#================================================================================
#监控系统进程数[进程数]
#================================================================================
Target[process]: .1.3.6.1.2.1.25.1.6.0&.1.3.6.1.2.1.25.1.6.0:public@localhost:
Options[process]: gauge,nopercent,growright
Directory[process]: process
MaxBytes[process]: 1000
YLegend[process]: Processes
ShortLegend[process]: 个
Legend1[process]: 系统进程数(个)
Legend2[process]:
LegendI[process]: 进程数:
LegendO[process]:
Title[process]: 系统进程数[进程数]
PageTop[process]:

系统进程数[进程数]


 
 
 
 
 
 
 
系统:system02
描述:系统进程数(个)
位置:办公服务器68
最大值:1000个
管理员:user@123.com

#==================================================================================
#监控硬盘空间[系统盘+数据盘]  !!参照前面的2) 这里需要与修改后snmpd.conf 的硬盘参数一致
#==================================================================================
Target[disk]: .1.3.6.1.4.1.2021.9.1.8.1&.1.3.6.1.4.1.2021.9.1.8.2:public@localhost:
Options[disk]: gauge,growright
Directory[disk]: disk
MaxBytes1[disk]: 10080520
MaxBytes2[disk]: 46251780
Kmg[disk]: k,M,G,T,P
Kilo[disk]: 1024
Unscaled[disk]: dwym
YLegend[disk]: Bytes
ShortLegend[disk]: B
Legend1[disk]: 系统盘已用空间
Legend2[disk]: 数据盘已用空间
LegendI[disk]: 系统已用:
LegendO[disk]: 数据已用:
Title[disk]: 硬盘空间[系统盘+数据盘]
PageTop[disk]:

硬盘空间[系统盘+数据盘]


 
 
 
 
 
 
 
系统:system02
描述:系统盘=/(/dev/sda2); 数据盘=/Datas(/dev/sda6)
位置:办公服务器68
最大值:系统盘=10.0GB; 数据盘=45.0GB
管理员:user@123.com

#================================================================================
#监控打开的TCP连接数[TCP连接数]
#================================================================================
Target[tcpopen]: .1.3.6.1.2.1.6.9.0&.1.3.6.1.2.1.6.9.0:public@localhost:
Options[tcpopen]: gauge,nopercent,growright
Directory[tcpopen]: tcpopen
MaxBytes[tcpopen]: 1000
YLegend[tcpopen]: Tcp Connections
ShortLegend[tcpopen]: 个
Legend1[tcpopen]: 打开的TCP连接数(个)
Legend2[tcpopen]:
LegendI[tcpopen]: TCP连接数:
LegendO[tcpopen]:
Title[tcpopen]: TCP连接数[TCP连接数]
PageTop[tcpopen]:

TCP连接数[TCP连接数]


 
 
 
 
 
 
 
系统:system02
描述:打开的TCP连接数(个)
位置:办公服务器68
最大值:1000个
管理员:user@123.com
###################### All Set Over #########################

注意<一>
在上面监控主机连续运行时间的配置中,有提到要使用/etc/mrtg/bin/mrtg-updays.pl这个文件。需要手动创建,内容如下:
#!/usr/bin/perl
$machine = `/bin/hostname`;
$uptime1 = `/usr/bin/uptime`;
$uptime2 = $uptime1;
$uptime1 =~ /up (.*?) day/;
$upday = int($1);
$uptime2 =~ /up (.*?) load/;
$uptime = $1;
print "$upday\n";
print "$upday\n";
print "$uptime\n";
print $machine."\n";
保存以后修改权限为可执行:
#chmod +x /etc/mrtg/bin/mrtg-updays.pl

注意<二>
关于硬盘参数,一定要注意
snmp.conf与mrtg.cfg中的格式、参数一定要一致,并且完全跟df -a*的命令结果相符。否则会得到输入错误的提示信息。
 
----------------------------
4) 生成工作目录及相关文件
----------------------------
mrtg /etc/mrtg/mrtg.cfg
 
----------------------------
5) 生成监控的页面文件
----------------------------
indexmaker --output /var/www/mrtg/index.html --title="System state Monitor" /etc/mrtg/mrtg.cfg
 
 
# camor原创并首发于http://camor.cublog.cn
# 转载和引用请先留言并注明出处!
# [By camornow$gmail.com]
阅读(4505) | 评论(5) | 转发(0) |
给主人留下些什么吧!~~

chinaunix网友2010-03-24 23:58:13

ERROR: no H1 line pagetop property in disk section 这个错误我曾经遇到过,主要是

尖括号中不能有任何空格。

chinaunix网友2010-01-16 18:20:07

当我在检测硬盘和tcp连接数的时候,无法怎么设置在进行生成页面的时候总是提示 [root@as156 mrtg]# /usr/bin/mrtg /etc/mrtg/mrtg.cfg ----------------------------------------------------------------------- ERROR: Mrtg will most likely not work properly when the environment variable LANG is set to UTF-8. Please run mrtg in an environment where this is not the case. Try the following command to start: env LANG=C /usr/bin/mrtg /etc/mrtg/mrtg.cfg -------------------------------------------------------------

chinaunix网友2009-01-15 11:35:00

保存一下

smallfish2008-08-28 22:07:17

能否共享下你的脚本,学习下?谢谢!