分类:
2006-08-12 06:39:39
问题描述
我的 N4000 服务器上装有 HP-UX 11.0。syslog.log 档案中出现了下面的错误讯息:
vmunix: SCSI: Request Timeout -- lbolt: 1406090869, dev:
我要如何判断是哪一个装置发生了 lbolt/timeout 错误?
组态信息
操作系统 - HP-UX
版本 - 11.0
硬件系统 - HP9000
系列 - N4000
子系统 - 系统管理
解决方法
您可以使用下列信息判断是哪个装置发生 lbolt/timeout 错误:
__ __ _ _ __
| | | | |
major# | Target | flags
| |
bus# lun
在以上信息中:
- major# (
- bus# (02) 为该装置所连接之适配卡的 Instance Number。
- target (6) 为该装置的 SCSI ID。
- lun (0) 为该装置的逻辑装置编号 (Logical Unit Number)。
因此,此装置所对应的 Device File 为 /dev/dsk/c2t6d0。
很多东西其实需要你的细心,那判断故障应该如何做呢:
1、关键命令的打印输出保存下列命令的输出
ioscan –fn
vgdisplay –v
pvdisplay –v $each_disk
lvdisplay –v $each_logical_volume
lvlnboot –v
kmtune(pa-risc) / kctune (integrity)
lanscan
ifconfig lan#
hostname /sbin/init.d/hostname脚本中可以修改主机名(name_of_host)。最大主机名长度定义/usr/include/sys/param.h,不能在GUI修改hostname,会导致GUI挂起.
Setboot
Lsdev
Lpstat –t
Bdf
Print_manifest (Ignite-UX组件,可以用于搜集系统参数信息等)
Mount –v
Swapinfo –tm
Uname –a
Model
Netstat –I
Netstat –rn
Swlist
2、关键配置文件的输出的hardcopy
/etc/inittab
/etc/fstab
/var/adm/sbtab (HFS文件系统中用来记录冗余superblock位置信息的文件,可以用来fsck-b的参数用来修复hfs文件系统。
/etc/hosts
/etc/nsswitch.conf
/etc/rc.config.d/netconf
/etc/inetd.conf 、/var/adm/inetd.sec(配置网络服务对指定客户端和客户组的安全访问)
/etc/rc.config.d/namesvrs
/etc/resolv.conf
/etc/lvmtab stings /etc/lvmtab |lp 可以查看文件的输出
/stand/system 内核的参数改变记录在/stand/krs中,这是个二进制文件,用kmtune来查看。
3、日志文件
System Log Files (系统日志文件)
Utmp 当前登陆用户 who察看 wtmp 登陆和退出记录文件 last察看
Btmp登陆失败文件记录lastb察看
Shutdownlog rc.log rc.log.old(如果要保存更长时间日志,修改/sbin/rc.utils)
/var/adm/syslog/Syslog.log OLDsyslog.log mail.log
修改 /etc/rc.config.d/netdaemons中 export INETD_ARGS=”-l” 可以在/var/adm/syslog/syslog.log中记录连接信息。
Ps –ef|grep inetd inetd –k inetd –l
ftp连接信息再syslog.log中的纪录 ftp stream tcp nowait root /usr/lbin/ftpd ftpd –L (该小写l为大写L) 重启动inetd inetd -c
System Log Book (系统改变记录记录和经验总结记录等)
如何做?
Top down (从日志察看开始分析)
Bottom up (从底层硬件开始分析)
Divide and conquer (如果对具体应用熟悉,可以直接从相关的部分进行问题隔离和分割处理)
4、做备份
Make_tape_recovery 是Ignite-UX组件中的命令,Ignite-UX在下列网址
不加参数的make_tape_recovery做最小os的磁带,其中内容在/opt/ignite/recovery/mnr_essentials中定义,如要想要加入自己的内容,只作一个备份放入/var/opt/ignite/recovery/mnr_essentials,然后编辑其中的内容,make_tape_recovery总是先检查/var目录中的这个文件,依据此文件来进行创建磁带。创建磁带时,/var目录要有
Make_tape_recovery –x inc_entire=vg00可以创建包含vg00的全备份
Make_tape_recovery –A创建整个文件系统,包括在其他VG上的文件系统。
l Files/Directories
-x include=
-x inc_cross=
-x exclude=
l Disks/Volume Groups
-x inc_entire=|/dev/dsk/
l Use a contents file
-f
l Archive all volume groups that contain essential files
Make_tape_recovery –A
例子
make_tape_recovery –x inc_entire=vg00 –x inc_entire=vg01 –x exclude=/tmp
make_tape_recovery的说明
LVM disk mirrors 不能够恢复,需要重新手工mirror
可以参考文档/opt/ignite/share/doc/diskmirror.pdf
VxVM磁盘组不包含在archive中,当恢复完成后,需要重新集成到系统中来
验证recovery tape
/var/opt/ignite/recovery//recovery.log
列出磁带上的内容
# mt –t /dev/rmt/0mn fsf 1
# tar tvf /dev/rmt/
/var/opt/ignite/recovery/latest/flist 可能归档备份到磁带上的内容
启动recovery tape
l power up the system (or B and RS)
l interrupt the boot
l load the recovery tape
l search for bootable devices (Main Menu>; sea ipl)
l boot from the recovery tape
l Automatic or interactive restore
make_net_recovery
网络备份可以使用2种方法
1. 从服务器端发起
add new client for recovery
create system recovery archive
select files for the client archive
monitoring creation of client archive (client status from action pulldown menu)
2. 从客户端发起
make_net_recovery –s IUX_server_name –x inc_entire=vg00 –x inc_entire=vg01 \
-x exclude=/depots
上面IUX_server_name指定恢复服务器
这个工作可以用cron自动调度来执行
从客户端启动的方法
PDC下
Bo lan.IP_Address_of_Ignite_server install
Don’t interact with IPL
Select [Install HP-UX], Select “Advanced Installation”
Fill in the appropriate networking information
Select the recovery configuration for your client