fmadm 无法使用的故障排除
设备:Sparc Enterprise M5000
命令简介:fmadm是sparc enterprise 机器用来查询是否有硬件故障的命令。其他机器可能没有这个工具,请区别对待。
使用fmadm 查询失败,提示 RPC: program not registered.
fmadm 使用smf-fmd服务查询硬件故障信息,经过查询 fmd状态
# svcs -a |grep fmd
offline 11:22:27 svc:/system/fmd:default
尝试online操作,还是失败。
查询svcs 报告,
#svcs -xv
svc:/system/fjsvdmpsnap:default (Crash Dump Assistant)
State: maintenance since Sun Apr 05 11:28:15 2009
Reason: Restarter svc:/system/svc/restarter:default gave no explanation.
See:
See: /var/svc/log/system-fjsvdmpsnap:default.log
Impact: This service is not running.
svc:/system/fmd:default
原来是fjsvdmpsnap 没有正常启动,导致fmd异常。
打开日志文件/var/svc/log/system-fjsvdmpsnap:default.log
最后几行内容如下
[ Apr 5 11:11:22 Method "start" exited with status 1 ]
[ Apr 5 11:11:31 Leaving maintenance because clear requested. ]
[ Apr 5 11:11:31 Enabled. ]
[ Apr 5 11:11:31 Executing start method ("/lib/svc/method/fjsvdmpsnap") ]
/lib/svc/method/fjsvdmpsnap: test: argument expected
[ Apr 5 11:11:31 Method "start" exited with status 1 ]
[ Apr 5 11:13:00 Leaving maintenance because clear requested. ]
[ Apr 5 11:13:00 Enabled. ]
[ Apr 5 11:13:00 Executing start method ("/lib/svc/method/fjsvdmpsnap") ]
脚本 /lib/svc/method/fjsvdmpsnap 运行失败了。
打开这个文件,添加入 set -x 调试,发现运行到某行
[ ! -d ${DUMPADM_SAVDIR} ] && /bin/mkdir -m 0700 -p ${DUMPADM_SAVDIR}
系统报错终止运行了。原来是 DUMPADM_SAVDIR 没有给出初始值导致的问题。
在文件头加入
DUMPADM_SAVDIR=/var/crash/`uname -n`
# svcadm disable fjsvdmpsnap
# svcadm enable fjsvdmpsnap
bash-3.00# svcadm clear fjsvdmpsnap
bash-3.00# svcs -a | grep fjsvdmpsnap
online 11:38:02 svc:/system/fjsvdmpsnap:default
bash-3.00# svcs -a | grep fmd
online 11:22:27 svc:/system/fmd:default
# fmadm faulty
以上运行都正常。
阅读(2562) | 评论(0) | 转发(0) |