Chinaunix首页 | 论坛 | 博客
  • 博客访问: 24305798
  • 博文数量: 271
  • 博客积分: 10025
  • 博客等级: 上将
  • 技术积分: 3358
  • 用 户 组: 普通用户
  • 注册时间: 2007-11-12 15:28
文章分类

全部博文(271)

文章存档

2010年(71)

2009年(164)

2008年(36)

我的朋友

分类: LINUX

2010-04-27 22:42:17

[英文原文]

版本:红帽企业版 Linux 4 及以后

Kdump / Netdump
  • 用来获取 vmcores
  • 分析 kernel panics 的唯一方法

配置
  • 红帽企业版 Linux 5 上配置 kdump 查看:
  • 红帽企业版 Linux 4 上配置 netdump 服务器和 netdump 客户端参考:

注意

  • 在红帽企业版 Linux 5 上 kdump 软件包提供获取 core 转储的软件。kdump 能通过网络由 scp(ssh)、nfs,或 ftp 进行转储 vmcores。
  • 在红帽企业版 Linux 4 上 netdump 软件包提供获取 core 转储的软件。Netdump 只能在预先配置好 netdump 服务器的情况下通过网络转储 vmcores。

建议
  • 推荐所有需要进行 panic 分析诊断的服务器上都配置 kdump / netdump。kdump / netdump 占用非常少磁盘空间并且对主机不会造成什么影响。

Sysstat

  • sysstat 软件包提供工具(iostat,mpstat,pidstat)和 cron 任务来收集系统使用的相关信息。

配置

  • 默认在红帽企业版 Linux 4 和 5 上会安装 sysstat 包
  • 如果没有安装 sysstat rpm 包(使用 rpm -a sysstat 来确认安装),可以在红帽企业版 Linux 5上使用 "yum install sysstat" 或在红帽企业版 Linux 4 上 “up2date sysstat” 来进行安装。

注意

  • sysstat 包的工具记录负载,磁盘使用,内存/交换分区,网络使用情况等。
  • 默 认记录的时间间隔是 10 分钟。如果要改变此间隔请参考这里过程的定义:
  • sysstat 不能获取关于指定进程的任何数据。如果需要指定进程的相关数据,请查看“批处理模式 Top”上的信息。

建议

  • 推荐在需要进行分析诊断的机器上运行 sysstat。sysstat 在机器上占用的负载非常小,同时只是每 10 分钟获取一次数据(默认)。

Hangwatch

  • Hangwatch 是一个用来当系统达到某个平均负载时触发执行 sysrq 命令的工具。

配置

  • hangwatch 工具是由红帽全球支持服务开发的,用来帮助诊断特殊的问题。此工具不能在官方的红帽仓库获得。请查看如下页面来下载此 RPM 包:
  • 请在 /etc/sysconfig/hangwatch 中配置需要被监控的平均负载的触发值(用 -t 参数)。
   
注意
  • Hangwatch 不能检测到 “hangs”,而此工具被设计为当达到特定的平均负载时来获取数据。
  • 默认当平均负载为 5 时会触发 sysrq 命令。对于大多数 SMP 服务器,平均负载到达 5 不会引起报警。
  • 请配合您的红帽软件支持工程师来针对每个 case 设置一个特殊的 trigger。每个新情况可能需要设置一个新的触发值。
   
建议
  • 请针对单个案例向红帽技术支持咨询何处需要 hangwatch。
  • 不推荐在生产机器上连续运行 hangwatch。
  • 请只在需要分析诊断负载问题时使用 hangwatch,并在诊断完成时禁止此服务(chkconfig hangwatch off;service hangwatch stop)。

Ksar

  • 图形化 sar 数据的开源项目
  • 此工具非常有用,因为它允许用户在 sar 数据中形象的观察到趋势和峰值。
  • 更多详情请访问 project 页面:

批处理模式中的 Top

  • 在批处理模式下运行 top 能够获取进程的具体信息。这对于检测哪个进程正在消耗大量 RAM 或 CPU 资源是很有用的。
  • 在批处理模式中执行 top 的简单方法是 “top -b -n -d ”。
  • 获取批处理模式的top输出的更高级的方法是:
    MYLOG="/tmp/top.`date +%b%d-%T`.log" ; 
    while [ 1 -eq 1 ];
    do date >>$MYLOG ;
    top -b -n 1 >>$MYLOG ;
    echo -e "\n\n" >>$MYLOG ;
    sleep 60 ;
    done
    • 此命令通过日期和时间戳来获取 top 输出(当进行比较 sar 数据时非常有用)
    • 可以通过改变 MYLOG 变量来调整记录日志的路径。
    • 可以通过改变 sleep 变量来调整获取频率(例如: Sleep 90)。

建议

  • 不推荐连续运行并且在批处理模式获取 top
  • 请针对逐个案例使用top批处理模式。当在某种情况下数据是有价值的,而在另外一种情况下数据却无意义。请向红帽技术支持咨询有关特定用法的案例细节。
阅读(2034) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~