1,通过HMC连接的主机点击Open terminal时出现open in process Open Completed然后没反应了,打开不了终端。
解决方法:
1、远程以root用户登录主机
2、找出虚拟终端所对应的“串口卡”设备:
# lsdev -C | grep Virtual
vsa0 Defined LPAR Virtual Serial Adapter
vsa1 Defined LPAR Virtual Serial Adapter
vsa2 Available LPAR Virtual Serial Adapter
3、找出虚拟终端所对应的tty设备:
# lsdev -p vsa2
4、启用此tty设备上的登录界面:
# penable vty2
2013年8月2日
在进行IBM P550巡检的时候使用errpt检查发现下面的错误
#errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
D666A8C7 0802140313 T H fcs0 ADAPTER ERROR
D666A8C7 0802140213 T H fcs0 ADAPTER ERROR
D666A8C7 0802140213 T H fcs0 ADAPTER ERROR
D666A8C7 0802140213 T H fcs0 ADAPTER ERROR
详细信息如下:
#errpt -aj D666A8C7 | more
---------------------------------------------------------------------------
LABEL: FCA_ERR2
IDENTIFIER: D666A8C7
Date/Time: Fri Aug 2 14:03:05 BEIST 2013
Sequence Number: 2087
Machine Id: 00C01CE64C00
Node Id: kjdb1
Class: H
Type: TEMP
WPAR: Global
Resource Name: fcs0
Resource Class: adapter
Resource Type: df1000fe
Location: U78A0.001.DNWHVZ9-P1-C1-T1
VPD:
Part Number.................10N7255
Serial Number...............1C018081E8
Manufacturer................001C
EC Level....................D76626
Customer Card ID Number.....5774
FRU Number.................. 10N7255
Device Specific.(ZM)........3
Network Address.............10000000C9C042D6
ROS Level and ID............02E8277F
Device Specific.(Z0)........2057706D
Device Specific.(Z1)........00000000
Device Specific.(Z2)........00000000
Device Specific.(Z3)........03000909
Device Specific.(Z4)........FFE01212
Device Specific.(Z5)........02E8277F
Device Specific.(Z6)........06E12715
Device Specific.(Z7)........07E1277F
Device Specific.(Z8)........20000000C9C042D6
Device Specific.(Z9)........ZS2.71X15
Device Specific.(ZA)........Z1F2.70A5
Device Specific.(ZB)........Z2F2.71X15
Device Specific.(ZC)........00000000
Description
ADAPTER ERROR
Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES
Detail Data
SENSE DATA
0000 0010 0000 0027 0502 0000 0000 0000 0001 0A00 22EF 59E4 0002 AEB7 0000 012C
0000 0001 0000 0001 0000 0000 0000 0000 0000 0002 0000 0000 0000 0000 0000 0000
0000 0000 0010 0002 0000 0010 0000 0000 0000 0000 0000 2710 0000 07D0 0000 076C
0000 0064 0000 000F 0000 0000 0000 0000 0000 0000 0000 0000 0006 0000 0000 0000
0019 0300 0000 0908 0010 8000 0800 00FF FFFF 0000 07D0 1000 0000 C9C0 42D6 2000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0300 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0100 8A00 0200
0019 0000 0000 0000 0000 0000 0000 0000 0000 0002 0000 0000 0000 0000 0000 0000
0000 0000 636D 4643 F100 0A0A 0070 17B8 F100 0A0A 0070 182C F100 0A0A 0070 18A0
0000 0000 0004 07B8 0000 0000 0004 082C 0000 0000 0004 08A0 0000 0000 0000 0000
0001 0C03 0000 0000 21FC 0005 1E9C 2AF7 1000 0005 1E9C 2AF7 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0074 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
---------------------------------------------------------------------------
起初怀疑是HBA卡出问题了,但是去机房检查发现指示灯均正常。连接到存储交换机查看也没有异常,初步判断是临时报错,继续观察。
另附errpt 输出信息的详细解释
1.错误标示符IDENTIFIER:并不唯一,由它来确定使用的错误模板,显然同一种错误的IDENTIFIER是相同的。
2.时间戳TIMESTAMP:错误发生的时间,MMDDhhmmYY,依次表示月日时分年。
3.类型TYPE:错误的类型,或者说严重的程度。 分为6个:
PEND 设备或功能组件可能丢失 简写P
PERF 性能严重下降 P
PERM 硬件设备或软件模块损坏,确诊了的 P
TEMP 临时性错误,经过重试后已经恢复正常 T
INFO 一般消息,不是错误 I
UNKN 不能确定错误的严重性 U
4.种类CLASS c:指出错误源 H 硬件或介质故障 S 软件故障 O 人为错误 U 不能确定
5. 资源名RESOURCE_NAME
最初检测到错误的资源名软件或者硬件,并不代表这个资源有问题,而只是最先在它发现的。
6.描述
2013.8.29
aix巡检查看HACMP状态时发现有一个进程没起来,具体如下:
#./clshowsrv -v
Status of the RSCT subsystems used by HACMP:
Subsystem Group PID Status
topsvcs topsvcs 4784376 active
grpsvcs grpsvcs 4915578 active
grpglsm grpsvcs inoperative
emsvcs emsvcs 3866690 active
emaixos emsvcs 9764866 active
ctrmc rsct 3801592 active
Status of the HACMP subsystems:
Subsystem Group PID Status
clcomdES clcomdES 3539194 active
clstrmgrES cluster 3866882 active
Status of the optional HACMP subsystems:
Subsystem Group PID Status
clinfoES cluster 12321116 active
这个进程无关紧要,不活动不会影响集群状态
详细解释如下:
he grpglsm subsystem is only responsible for handling the various PSSP
switch adapters (css*), and the new federation adapters (sn*); it has
nothing to do with standard ethernet switches. I
believe at one time grpglsm would simply sit and do nothing on an HACMP
cluster without one of these adapters on it. Now it simply shutsdown
when not needed. This is normal, and nothing you need to worry about,
unless you are using one of those adapter types.
So I think that answers this questions.
2013年12月2日 NFS报错
# mount test23:/arch_test23 /arch_test23
mount: 1831-011 access denied for lydb23:/test23
mount: 1831-008 giving up on:
test:/test23
The file access permissions do not allow the specified action.
解决方法
1 ,将文件 /etc/exports 中 "access=xxxxx" 的部分刪除;
2 ,在服务器端运行 # exportfs -a
重新挂在即可
2014.1.10
主机报错
# errpt
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
EAA3D429 0110083214 U S LVDD PHYSICAL PARTITION MARKED
STALE
EAA3D429 0110083214 U S LVDD PHYSICAL PARTITION MARKED
STALE
EAA3D429 0110083214 U S LVDD PHYSICAL PARTITION MARKED
STALE
EAA3D429 0110083214 U S LVDD PHYSICAL PARTITION MARKED
STALE
查看详细报错信息
# errpt -aj EAA3D429
---------------------------------------------------------------------------
LABEL: LVM_SA_STALEPP
IDENTIFIER: EAA3D429
Date/Time: Fri Jan 10 08:32:23 BEIST 2014
Sequence Number: 1672
Machine Id: 00CFF5FF4C00
Node Id: fsdb2
Class: S
Type: UNKN
Resource Name: LVDD
Description
PHYSICAL PARTITION MARKED STALE
Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0016 0000 0000
PHYSICAL PARTITION NUMBER (DECIMAL)
362
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 000A 0000 000A
SENSE DATA
00CF F5FF 0000 4C00 0000 0126 06A0 ED66 00CF F5FF B95A E907 0000 0000 0000
0000
怀疑是硬盘问题,继续排查
# lsvg -p rootvg
rootvg:
PV_NAME PV STATE TOTAL PPs FREE PPs FREE DISTRIBUTION
hdisk0 active 546 112 29..25..00..00..58
hdisk1 missing 546 112 29..25..00..00..58
到这里确定硬盘出现错误。
尝试找回
# chpv -va hdisk1
0516-1010 chpv: Warning, the physical volume hdisk1 has open logical
volumes. Continuing with change.
更换步骤:
1、破除镜像
把HDISK1从ROOTVG中不做MIRROW:
#unmirrorvg rootvg hdisk1
#reducevg rootvg hdisk1
删除HDISK1
#rmdev –dl hdisk1
在hdisk1上创建boot image
#bosboot –ad /dev/hdisk0
改变启动设备的顺序
#bootlist –m normal hdisk0 cd0
确认硬盘位置,然后进行更换
更换后的操作
1.把hdisk1加进rootvg卷组:
#extendvg rootvg hdisk1
2.关掉rootvg的 QUORUM功能:
#chvg -Qn rootvg
3.镜像rootvg
#mirrorvg -c 2 rootvg
4.重新生成 boot image
#bosboot -ad /dev/hdisk1
5.更新bootlist
#bootlist -m normal hdisk0 hdisk1 cd0