Chinaunix首页 | 论坛 | 博客
  • 博客访问: 652741
  • 博文数量: 70
  • 博客积分: 145
  • 博客等级: 入伍新兵
  • 技术积分: 1150
  • 用 户 组: 普通用户
  • 注册时间: 2012-10-11 08:15
个人简介

没有简介就是最好的简介

文章分类

全部博文(70)

文章存档

2020年(1)

2018年(2)

2017年(3)

2016年(11)

2015年(12)

2014年(16)

2013年(19)

2012年(6)

我的朋友

分类: AIX

2013-01-23 10:07:57

1,通过HMC连接的主机点击Open terminal时出现open in process Open Completed然后没反应了,打开不了终端。

 解决方法:

 1、远程以root用户登录主机

 2、找出虚拟终端所对应的“串口卡”设备:

 # lsdev -C | grep Virtual

vsa0 Defined LPAR Virtual Serial Adapter

vsa1 Defined LPAR Virtual Serial Adapter

vsa2 Available LPAR Virtual Serial Adapter

3、找出虚拟终端所对应的tty设备:

 # lsdev -p vsa2

4、启用此tty设备上的登录界面:

 # penable vty2

2013年8月2日
在进行IBM P550巡检的时候使用errpt检查发现下面的错误
#errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
D666A8C7   0802140313 T H fcs0           ADAPTER ERROR
D666A8C7   0802140213 T H fcs0           ADAPTER ERROR
D666A8C7   0802140213 T H fcs0           ADAPTER ERROR
D666A8C7   0802140213 T H fcs0           ADAPTER ERROR
详细信息如下:
#errpt -aj D666A8C7 | more
---------------------------------------------------------------------------
LABEL:          FCA_ERR2
IDENTIFIER:     D666A8C7

Date/Time:       Fri Aug  2 14:03:05 BEIST 2013
Sequence Number: 2087
Machine Id:      00C01CE64C00
Node Id:         kjdb1
Class:           H
Type:            TEMP
WPAR:            Global
Resource Name:   fcs0            
Resource Class:  adapter
Resource Type:   df1000fe
Location:        U78A0.001.DNWHVZ9-P1-C1-T1
VPD:             
        Part Number.................10N7255
        Serial Number...............1C018081E8
        Manufacturer................001C
        EC Level....................D76626
        Customer Card ID Number.....5774
        FRU Number.................. 10N7255
        Device Specific.(ZM)........3
        Network Address.............10000000C9C042D6
        ROS Level and ID............02E8277F
        Device Specific.(Z0)........2057706D
        Device Specific.(Z1)........00000000
        Device Specific.(Z2)........00000000
        Device Specific.(Z3)........03000909
        Device Specific.(Z4)........FFE01212
        Device Specific.(Z5)........02E8277F
        Device Specific.(Z6)........06E12715
        Device Specific.(Z7)........07E1277F
        Device Specific.(Z8)........20000000C9C042D6
        Device Specific.(Z9)........ZS2.71X15
        Device Specific.(ZA)........Z1F2.70A5
        Device Specific.(ZB)........Z2F2.71X15
        Device Specific.(ZC)........00000000

Description
ADAPTER ERROR

        Recommended Actions
        PERFORM PROBLEM DETERMINATION PROCEDURES

Detail Data
SENSE DATA
0000 0010 0000 0027 0502 0000 0000 0000 0001 0A00 22EF 59E4 0002 AEB7 0000 012C
0000 0001 0000 0001 0000 0000 0000 0000 0000 0002 0000 0000 0000 0000 0000 0000
0000 0000 0010 0002 0000 0010 0000 0000 0000 0000 0000 2710 0000 07D0 0000 076C
0000 0064 0000 000F 0000 0000 0000 0000 0000 0000 0000 0000 0006 0000 0000 0000
0019 0300 0000 0908 0010 8000 0800 00FF FFFF 0000 07D0 1000 0000 C9C0 42D6 2000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0300 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0100 8A00 0200
0019 0000 0000 0000 0000 0000 0000 0000 0000 0002 0000 0000 0000 0000 0000 0000
0000 0000 636D 4643 F100 0A0A 0070 17B8 F100 0A0A 0070 182C F100 0A0A 0070 18A0
0000 0000 0004 07B8 0000 0000 0004 082C 0000 0000 0004 08A0 0000 0000 0000 0000
0001 0C03 0000 0000 21FC 0005 1E9C 2AF7 1000 0005 1E9C 2AF7 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0074 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
---------------------------------------------------------------------------
起初怀疑是HBA卡出问题了,但是去机房检查发现指示灯均正常。连接到存储交换机查看也没有异常,初步判断是临时报错,继续观察。

另附errpt 输出信息的详细解释
1.错误标示符IDENTIFIER:并不唯一,由它来确定使用的错误模板,显然同一种错误的IDENTIFIER是相同的。    
2.时间戳TIMESTAMP:错误发生的时间,MMDDhhmmYY,依次表示月日时分年。    
3.类型TYPE:错误的类型,或者说严重的程度。    分为6个: 
PEND 设备或功能组件可能丢失 简写P    
PERF 性能严重下降 P 
PERM 硬件设备或软件模块损坏,确诊了的 P    
TEMP 临时性错误,经过重试后已经恢复正常 T  
INFO 一般消息,不是错误 I    
UNKN 不能确定错误的严重性 U    
4.种类CLASS c:指出错误源    H 硬件或介质故障    S 软件故障    O 人为错误    U 不能确定 
5. 资源名RESOURCE_NAME 
 最初检测到错误的资源名软件或者硬件,并不代表这个资源有问题,而只是最先在它发现的。    
6.描述

2013.8.29
aix巡检查看HACMP状态时发现有一个进程没起来,具体如下:
#./clshowsrv -v
Status of the RSCT subsystems used by HACMP:
Subsystem         Group            PID          Status
 topsvcs          topsvcs          4784376      active
 grpsvcs          grpsvcs          4915578      active
 grpglsm          grpsvcs                       inoperative
 emsvcs           emsvcs           3866690      active
 emaixos          emsvcs           9764866      active
 ctrmc            rsct             3801592      active

Status of the HACMP subsystems:
Subsystem         Group            PID          Status
 clcomdES         clcomdES         3539194      active
 clstrmgrES       cluster          3866882      active

Status of the optional HACMP subsystems:
Subsystem         Group            PID          Status
 clinfoES         cluster          12321116     active
这个进程无关紧要,不活动不会影响集群状态
详细解释如下:
he grpglsm subsystem is only responsible for handling the various PSSP
switch adapters (css*), and the new federation adapters (sn*); it has
nothing to do with standard ethernet switches. I
believe at one time grpglsm would simply sit and do nothing on an HACMP
cluster without one of these adapters on it. Now it simply shutsdown
when not needed. This is normal, and nothing you need to worry about,
unless you are using one of those adapter types.
So I think that answers this questions.

2013年12月2日 NFS报错
# mount test23:/arch_test23 /arch_test23
mount: 1831-011 access denied for lydb23:/test23
mount: 1831-008 giving up on:
test:/test23
The file access permissions do not allow the specified action.
 解决方法
1 ,将文件 /etc/exports 中 "access=xxxxx" 的部分刪除;
2 ,在服务器端运行 #  exportfs  -a
重新挂在即可 

2014.1.10
主机报错
# errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
EAA3D429   0110083214 U S LVDD           PHYSICAL PARTITION MARKED STALE
EAA3D429   0110083214 U S LVDD           PHYSICAL PARTITION MARKED STALE
EAA3D429   0110083214 U S LVDD           PHYSICAL PARTITION MARKED STALE
EAA3D429   0110083214 U S LVDD           PHYSICAL PARTITION MARKED STALE
查看详细报错信息
# errpt -aj EAA3D429
---------------------------------------------------------------------------
LABEL:          LVM_SA_STALEPP
IDENTIFIER:     EAA3D429
 
Date/Time:       Fri Jan 10 08:32:23 BEIST 2014
Sequence Number: 1672
Machine Id:      00CFF5FF4C00
Node Id:         fsdb2
Class:           S
Type:            UNKN
Resource Name:   LVDD           
 
Description
PHYSICAL PARTITION MARKED STALE
 
Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0016 0000 0000
PHYSICAL PARTITION NUMBER (DECIMAL)
                   362
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 000A 0000 000A
SENSE DATA
00CF F5FF 0000 4C00 0000 0126 06A0 ED66 00CF F5FF B95A E907 0000 0000 0000 0000
怀疑是硬盘问题,继续排查
# lsvg -p rootvg
rootvg:
PV_NAME           PV STATE          TOTAL PPs   FREE PPs    FREE DISTRIBUTION
hdisk0            active            546         112         29..25..00..00..58
hdisk1            missing           546         112         29..25..00..00..58
到这里确定硬盘出现错误。
尝试找回
# chpv -va hdisk1
0516-1010 chpv: Warning, the physical volume hdisk1 has open logical
        volumes.  Continuing with change.
更换步骤:
1、破除镜像
把HDISK1从ROOTVG中不做MIRROW:
#unmirrorvg rootvg hdisk1  
#reducevg rootvg hdisk1  
删除HDISK1
#rmdev –dl hdisk1  
在hdisk1上创建boot image  
#bosboot –ad /dev/hdisk0
改变启动设备的顺序  
#bootlist –m normal hdisk0 cd0  
确认硬盘位置,然后进行更换
更换后的操作
1.把hdisk1加进rootvg卷组:
#extendvg rootvg hdisk1
2.关掉rootvg的 QUORUM功能:
#chvg -Qn rootvg
3.镜像rootvg
#mirrorvg -c 2 rootvg
4.重新生成 boot image
#bosboot -ad /dev/hdisk1
5.更新bootlist
#bootlist -m normal hdisk0 hdisk1 cd0

阅读(6704) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~