Chinaunix首页 | 论坛 | 博客
  • 博客访问: 424639
  • 博文数量: 75
  • 博客积分: 2780
  • 博客等级: 少校
  • 技术积分: 789
  • 用 户 组: 普通用户
  • 注册时间: 2008-12-23 20:38
文章分类

全部博文(75)

文章存档

2012年(1)

2011年(11)

2010年(12)

2009年(39)

2008年(12)

我的朋友

分类: LINUX

2008-12-30 07:17:20


  一、系统监控接口程序(interface.php)具有的报警方式
  1、MSN实时报警
  ①、监控程序每次检测到故障存在、或者故障恢复,都会发送短消息到管理员的MSN。

  发送MSN短消息用了一个PHP类:,使用该PHP类发消息,必须将发送、接收双方的MSN加为联系人,发送中文时,先用iconv将字符集转为UTF-8:
引用
$sendMsg->sendMessage(iconv("GBK", "UTF-8", $message), 'Times New Roman', '008000');




  2、手机短信报警
  ①、工作日早上10点之前,晚上6点之后,以及周六、周日,监控程序检测到故障,会调用手机短信接口,发送短信给管理员的手机。
  ②、如果监控程序多次检测到同一台服务器的同一类故障,只会在第一次检测到故障时发送一条“故障报警”短信。服务器故障恢复后,监控程序会再发送一条“故障恢复”短信。

  如果没有手机短信网关接口,可以试试中国移动通信的邮箱,具有免费的邮件到达手机短信通知功能,可以将收到的邮件标题以短信的形式发送到手机上。



  3、电子邮件报警
  ①、如果监控程序多次检测到同一台服务器的同一类故障,只会在第一次检测到故障时发送一封“故障报警”邮件。服务器故障恢复后,监控程序会再发送一封“故障恢复”邮件。

  系统监控接口程序interface.php(核心部分,仅提供部分代码):
  1. //HTTP服务器监控  
  2. if (htmlspecialchars($_POST["menu"]) == "http")     
  3. {     
  4.     $date = htmlspecialchars($_POST["date"]);     
  5.     $ip = htmlspecialchars($_POST["ip"]);  
  6.     $port = htmlspecialchars($_POST["port"]);  
  7.     $status = htmlspecialchars($_POST["status"]);//状态,0表示无法访问,1表示正常,2表示无法访问但能ping通  
  8.     //...下一步处理(省略)...    
  9. }  
  10.   
  11. //TCP服务器监控  
  12. if (htmlspecialchars($_POST["menu"]) == "tcp")     
  13. {     
  14.     $date = htmlspecialchars($_POST["date"]);     
  15.     $ip = htmlspecialchars($_POST["ip"]);  
  16.     $port = htmlspecialchars($_POST["port"]);  
  17.     $status = htmlspecialchars($_POST["status"]);//状态,0表示无法访问,1表示正常,2表示无法访问但能ping通  
  18.     //...下一步处理(省略)...  
  19. }  
  20.   
  21. //MySQL服务器监控  
  22. if (htmlspecialchars($_POST["menu"]) == "mysql")     
  23. {     
  24.     $date = htmlspecialchars($_POST["date"]);     
  25.     $ip = htmlspecialchars($_POST["ip"]);  
  26.     $port = htmlspecialchars($_POST["port"]);  
  27.     $abstract = htmlspecialchars($_POST["abstract"]);//故障摘要(必须为全角)  
  28.     $info = htmlspecialchars($_POST["info"]);//故障详细描述  
  29.     $failback = htmlspecialchars($_POST["failback"]);//如果服务器存活,此处接收的值为active  
  30.     //...下一步处理(省略)...  
  31. }  
  32. ?>  


  二、主动探测监控(“监控机”主动探测“被监控机”)
  1、HTTP服务器监控
  脚本:/data0/monitor/http.sh
引用
#!/bin/sh
LANG=C

#被监控服务器、端口列表
server_all_list=(\
192.168.1.1:80 \
192.168.1.2:80 \
192.168.1.3:80 \
)

date=$(date -d "today" +"%Y-%m-%d_%H:%M:%S")

#采用HTTP POST方式发送检测信息给接口程序interface.php,接口程序负责分析信息,决定是否发送报警MSN消息、手机短信、电子邮件。
send_msg_to_interface()
{
   /usr/bin/curl -m 600 -d menu=http -d date=$date -d ip=$server_ip -d port=$server_port -d status=$status 
}

server_all_len=${#server_all_list[*]}
i=0
while  [ $i -lt $server_all_len ]
do
   server_ip=$(echo ${server_all_list[$i]} | awk -F ':' '{print $1}')
   server_port=$(echo ${server_all_list[$i]} | awk -F ':' '{print $2}')
   if curl -m 10 -G {server_all_list[$i]}/ > /dev/null 2>&1
   then
     #status:    0,http down    1,http ok    2,http down but ping ok 
     status=1
           echo "服务器${server_ip},端口${server_port}能够正常访问!"
   else
       if curl -m 30 -G {server_all_list[$i]}/ > /dev/null 2>&1
       then
           status=1
           echo "服务器${server_ip},端口${server_port}能够正常访问!"
       else
           if ping -c 1 $server_ip > /dev/null 2>&1
           then
               status=2
               echo "服务器${server_ip},端口${server_port}无法访问,但是能够Ping通!"
           else
               status=0
               echo "服务器${server_ip},端口${server_port}无法访问,并且无法Ping通!"
           fi
       fi
   fi
 send_msg_to_interface
   let i++
done



  2、TCP服务器监控
  脚本:/data0/monitor/tcp.sh
引用
#!/bin/sh
LANG=C

#被监控服务器、端口列表
server_all_list=(\
192.168.1.4:11211 \
192.168.1.5:11211 \
192.168.1.6:25 \
192.168.1.7:25 \
)

date=$(date -d "today" +"%Y-%m-%d_%H:%M:%S")

#采用HTTP POST方式发送检测信息给接口程序interface.php,接口程序负责分析信息,决定是否发送报警MSN消息、手机短信、电子邮件。
send_msg_to_interface()
{
   /usr/bin/curl -m 600 -d menu=tcp -d date=$date -d ip=$server_ip -d port=$server_port -d status=$status 
}

server_all_len=${#server_all_list[*]}
i=0
while  [ $i -lt $server_all_len ]
do
   server_ip=$(echo ${server_all_list[$i]} | awk -F ':' '{print $1}')
   server_port=$(echo ${server_all_list[$i]} | awk -F ':' '{print $2}')
   if nc -vv -z -w 3 $server_ip $server_port > /dev/null 2>&1
   then
       #status:    0,http down    1,http ok    2,http down but ping ok 
       status=1
       echo "服务器${server_ip},端口${server_port}能够正常访问!"
   else
       if nc -vv -z -w 10 $server_ip $server_port > /dev/null 2>&1
       then
           status=1
           echo "服务器${server_ip},端口${server_port}能够正常访问!"
       else
           if ping -c 1 $server_ip > /dev/null 2>&1
           then
               status=2
               echo "服务器${server_ip},端口${server_port}无法访问,但是能够Ping通!"
           else
               status=0
               echo "服务器${server_ip},端口${server_port}无法访问,并且无法Ping通!"
           fi
       fi
   fi
   send_msg_to_interface
   let i++
done



  3、MySQL服务器监控
  ①、MySQL是否能够连接
  ②、MySQL是否发生表损坏等错误
  ③、MySQL活动连接数是否过多
  ④、MySQL从库是否同步正常
  ⑤、MySQL从库同步延迟时间是否过大
  脚本:/data0/monitor/mysql.php
  1. //$server_list[]="服务器地址:端口:帐号:密码";  
  2. $server_list[]="192.168.1.11:3306:root:password";  
  3. $server_list[]="192.168.1.12:3306:root:password";  
  4. $server_list[]="192.168.1.13:3306:root:password";  
  5.   
  6. $database="mysql";  
  7.   
  8. $curl = new Curl_Class();   
  9.   
  10. foreach ($server_list as $server) {  
  11.     $status=1;//初始化,正常状态  
  12.   unset($data);  
  13.     $data["menu"] = "mysql";  
  14.   $data["info"] = "";  
  15.     list($data["ip"], $data["port"], $username$password) = explode(":"$server);  
  16.   
  17.     $connect = @mysql_connect($data["ip"].":".$data["port"], $username$password);  
  18.     if(! $connect)  
  19.     {  
  20.         $status=0;  
  21.         $data["info"] = $data["info"] . "无法连接MySQL服务器\r\n";  
  22.     }  
  23.     
  24.     $select = @mysql_select_db($database$connect);  
  25.     $result = @mysql_query("show slave status");  
  26.     $rs_slave = @mysql_fetch_array($result);  
  27.     $result = @mysql_query("show global status like 'Threads_running'");  
  28.     $rs_threads = @mysql_fetch_array($result);  
  29.     if($rs_slave["Slave_SQL_Running"] == "No")  
  30.     {  
  31.         $status=0;//故障状态  
  32.         $data["abstract"] = "从库不同步";  
  33.         $data["info"] = $data["info"] . "Slave_SQL_Running = No\r\n";    
  34.     }  
  35.     if($rs_slave["Slave_IO_Running"] == "No")  
  36.     {  
  37.         $status=0;  
  38.         $data["abstract"] = "从库不同步";  
  39.         $data["info"] = $data["info"] . "Slave_IO_Running = No\r\n";    
  40.     }  
  41.     if($rs_slave["Last_Error"] != "")  
  42.     {  
  43.         $status=0;  
  44.         $data["abstract"] = "从库同步出错";  
  45.         $data["info"] = $data["info"] . "Last_Error = ".substr($rs_slave["Last_Error"], 0, 40)."\r\n";  
  46.     }  
  47.     if($rs_slave["Seconds_Behind_Master"] > 180)  
  48.     {  
  49.         $status=0;  
  50.         $data["abstract"] = "从库同步延迟时间高达".$rs_slave["Seconds_Behind_Master"]."秒";  
  51.         $data["info"] = $data["info"] . "Seconds_Behind_Master = ".$rs_slave["Seconds_Behind_Master"]."\r\n";  
  52.     }  
  53.     if($rs_threads["Value"] > 60)  
  54.     {  
  55.         $status=0;  
  56.         $data["abstract"] = "活动连接数多达".$rs_threads["Value"];  
  57.         $data["info"] = $data["info"] . "Threads_running = ".$rs_threads["Value"]."\r\n";  
  58.     }  
  59.   
  60.     $data["date"] = date("Y-m-d_H:i:s");  
  61.     if($status == 0)  
  62.     {  
  63.         $post = @$curl->post(""$data);  
  64.         echo "MySQL服务器“".$data["ip"].":".$data["port"]."”发生故障!\n";  
  65.         print_r($post);        
  66.     }  
  67.     else  
  68.     {  
  69.         $data["failback"] = "active";//服务器正常,发送通知信息  
  70.         $post = @$curl->post(""$data);  
  71.         echo "MySQL服务器“".$data["ip"].":".$data["port"]."”运行正常!\n";  
  72.         print_r($post);  
  73.     }  
  74. }  
  75.   
  76. /** 
  77. ********************************************************************* 
  78. * Curl_Class :curl 类 
  79. *********************************************************************/  
  80. class Curl_Class  
  81. {  
  82.     function Curl_Class()  
  83.     {  
  84.         return true;  
  85.     }  
  86.   
  87.     function execute($method$url$fields = ''$userAgent = ''$httpHeaders = '',  
  88.         $username = ''$password = '')  
  89.     {  
  90.         $ch = Curl_Class::create();  
  91.         if (false === $ch)  
  92.         {  
  93.             return false;  
  94.         }  
  95.   
  96.         if (is_string($url) && strlen($url))  
  97.         {  
  98.             $ret = curl_setopt($ch, CURLOPT_URL, $url);  
  99.         }  
  100.         else  
  101.         {  
  102.             return false;  
  103.         }  
  104.         //是否显示头部信息  
  105.         curl_setopt($ch, CURLOPT_HEADER, false);  
  106.         //  
  107.         curl_setopt($ch, CURLOPT_RETURNTRANSFER, true);  
  108.   
  109.         if ($username != '')  
  110.         {  
  111.             curl_setopt($ch, CURLOPT_USERPWD, $username . ':' . $password);  
  112.         }  
  113.   
  114.         $method = strtolower($method);  
  115.         if ('post' == $method)  
  116.         {  
  117.             curl_setopt($ch, CURLOPT_POST, true);  
  118.             if (is_array($fields))  
  119.             {  
  120.                 $sets = array();  
  121.                 foreach ($fields as $key => $val)  
  122.                 {  
  123.                     $sets[] = $key . '=' . urlencode($val);  
  124.                 }  
  125.                 $fields = implode('&'$sets);  
  126.             }  
  127.             curl_setopt($ch, CURLOPT_POSTFIELDS, $fields);  
  128.         }  
  129.         else  
  130.             if ('put' == $method)  
  131.             {  
  132.                 curl_setopt($ch, CURLOPT_PUT, true);  
  133.             }  
  134.   
  135.         //curl_setopt($ch, CURLOPT_PROGRESS, true);  
  136.         //curl_setopt($ch, CURLOPT_VERBOSE, true);  
  137.         //curl_setopt($ch, CURLOPT_MUTE, false);  
  138.         curl_setopt($ch, CURLOPT_TIMEOUT, 600);  
  139.   
  140.         if (strlen($userAgent))  
  141.         {  
  142.             curl_setopt($ch, CURLOPT_USERAGENT, $userAgent);  
  143.         }  
  144.   
  145.         if (is_array($httpHeaders))  
  146.         {  
  147.             curl_setopt($ch, CURLOPT_HTTPHEADER, $httpHeaders);  
  148.         }  
  149.   
  150.         $ret = curl_exec($ch);  
  151.   
  152.         if (curl_errno($ch))  
  153.         {  
  154.             curl_close($ch);  
  155.             return array(curl_error($ch), curl_errno($ch));  
  156.         }  
  157.         else  
  158.         {  
  159.             curl_close($ch);  
  160.             if (!is_string($ret) || !strlen($ret))  
  161.             {  
  162.                 return false;  
  163.             }  
  164.             return $ret;  
  165.         }  
  166.     }  
  167.   
  168.     function post($url$fields$userAgent = ''$httpHeaders = ''$username = '',  
  169.         $password = '')  
  170.     {  
  171.         $ret = Curl_Class::execute('POST'$url$fields$userAgent$httpHeaders$username,  
  172.             $password);  
  173.         if (false === $ret)  
  174.         {  
  175.             return false;  
  176.         }  
  177.   
  178.         if (is_array($ret))  
  179.         {  
  180.             return false;  
  181.         }  
  182.         return $ret;  
  183.     }  
  184.   
  185.     function get($url$userAgent = ''$httpHeaders = ''$username = ''$password =  
  186.         '')  
  187.     {  
  188.         $ret = Curl_Class::execute('GET'$url''$userAgent$httpHeaders$username,  
  189.             $password);  
  190.         if (false === $ret)  
  191.         {  
  192.             return false;  
  193.         }  
  194.   
  195.         if (is_array($ret))  
  196.         {  
  197.             return false;  
  198.         }  
  199.         return $ret;  
  200.     }  
  201.   
  202.     function create()  
  203.     {  
  204.         $ch = null;  
  205.         if (!function_exists('curl_init'))  
  206.         {  
  207.             return false;  
  208.         }  
  209.         $ch = curl_init();  
  210.         if (!is_resource($ch))  
  211.         {  
  212.             return false;  
  213.         }  
  214.         return $ch;  
  215.     }  
  216.   
  217. }  
  218. ?>  


  4、主动监控守护进程
  脚本:/data0/monitor/monitor.sh
引用
#!/bin/sh
while true
do
   /bin/sh /data0/monitor/http.sh > /dev/null 2>&1
   /bin/sh /data0/monitor/tcp.sh > /dev/null 2>&1
   /usr/local/php/bin/php /data0/monitor/mysql.php > /dev/null 2>&1
   sleep 10
done


  启动主动监控守护进程:
/usr/bin/nohup /bin/sh /data0/monitor/monitor.sh 2>&1 > /dev/null &



  三、被动报告监控(“被监控机”采集数据发送给“监控机”)
  1、磁盘空间使用量监控
  2、磁盘Inode使用量监控
  3、Swap交换空间使用量监控
  4、系统负载监控
  5、Apache进程数监控

  被动监控这部分,在我的文章《写完“Linux服务器监控系统 ServMon V1.1” 》中已经实现,就不再详细写出。
阅读(3748) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~