Chinaunix首页 | 论坛 | 博客
  • 博客访问: 25881382
  • 博文数量: 271
  • 博客积分: 10025
  • 博客等级: 上将
  • 技术积分: 3358
  • 用 户 组: 普通用户
  • 注册时间: 2007-11-12 15:28
文章分类

全部博文(271)

文章存档

2010年(71)

2009年(164)

2008年(36)

我的朋友

分类:

2009-11-13 10:58:51

TS_NIM_ERROR_STUCK,TS_LATEHB_PE解决办法

   

环境

AIX5.3 HA5.3

问题描述

errpt -a 出现报错:TS_NIM_ERROR_STUCK,TS_LATEHB_PE
需要知道报错原因以及解决方法

解答

报错原因如下:
1.CPU太忙不能及时发送心跳信息
2.太多I/O请求,发送心跳的线程被阻塞
TS_NIM_ERROR_STUCK报错是因为Top.Services由于某些性能问题导致不能定时访问CPU.
topology 服务集产生的NIM线程监控着本地适配器,这些线程负责发送和接收点对点的域之间的信息.
他们监控着来自某个节点的心跳信息,然后将心跳信息发送到目标适配器.当本地适配器down或者up时,
NIM还负责通知本地daemons.
TS_NIM_ERROR_STUCK意味着NIM进程被阻塞了一段时间.
解决办法:
1.停止cluster服务
# smitty hacmp
- Extended Configuration - Extended Topology Configuration -
Configure HACMP Network Modules - Change a Network Module using
Predefined Values
- 选择 non-serial (tty or dhbeat and ether one at a time)
- 修改 normal 为 slow
- 同步
2.升级如下软件包:
bos.rte.libpthreads 5.3.0.61
rsct.basic.hacmp 2.4.7.1

TS_LATEHB_PE报错解决办法:
1. smitty chgsys
修改如下行:
for pending write I/Os per file [0]
LOW for pending write I/Os per file [0]

设置 to 33
设置 low to 24

2. vi /sbin/rc.boot
找到如下行:
nohup /usr/sbin/syncd 60 > /dev/null 2>&1 &
修改成如下形式
nohup /usr/sbin/syncd 10 > /dev/null 2>&1 &

阅读(1663) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~