Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2519668
  • 博文数量: 323
  • 博客积分: 10211
  • 博客等级: 上将
  • 技术积分: 4934
  • 用 户 组: 普通用户
  • 注册时间: 2006-08-27 14:56
文章分类

全部博文(323)

文章存档

2012年(5)

2011年(3)

2010年(6)

2009年(140)

2008年(169)

分类: 系统运维

2008-10-17 21:29:40

本文介绍DLPAR的配置方法和RMC(Resource Monitoring and Control)授权和验证方式.

一. 配置DLPAR的要求

建议将HMC (Hardware Management Console) 的版本升级到 Release 3, Level 2.4或以上,可以运
行 hsc version命令来确认版本。LPAR中操作系统的版本需要AIX 5.2或以上版本,并且安装如下软
件包:

rsct.core*
csm.client


二. 设置与DLPAR相关的守护进程

1. 检查HMC上守护进程运行的情况
# su - root
# lssrc -a
Subsystem Group PID Status
ctrmc rsct 822 active
IBM.DMSRM rsct_rm 906 active
IBM.LparCmdRM rsct_rm 901 active

如果以上的守护进程都是active的,则跳到步骤2,如果以上任何守护进程处于inoperative状态,采
用以下命令手工启动它,startsrc -s <进程名>,如: startsrc -s ctrmc。如果进程仍然无法启动,
请与IBM联系。

2. 在每一个需要支持DLPAR的分区中检查AIX的守护进程运行的情况。
> su - root
> lssrc -a | grep rsct

Subsystem Group PID Status
ctrmc rsct 21044 active
IBM.CSMAgentRM rsct_rm 21045 active
IBM.ServiceRM rsct_rm 11836 active
IBM.DRM rsct_rm 20011 active
IBM.HostRM rsct_rm 20012 active

IBM.DRM和IBM.HostRM属于 "lazy started" 进程,它们只在被使用时才处于active状态,如果IBM.DRM
和IBM.HostRM处于inoperative状态,很可能是网络或主机名设置问题,请参阅 三,如果以上进程处于
inoperative状态,用以下命令手工启动它,startsrc -s <进程名>,如:

startsrc -s IBM.CSMAgentRM。

在AIX 5.2 ML2以后的版本中,ctcas也属于 "lazy started" 进程,如果处于inoperative状态,不
需要手工启动。

三. 设置RMC/DLPAR网络和主机名

通常DLPAR的问题都与不正确的设置网络和主机名有关。DLPAR要求在HMC和每个LPAR上主机名与IP地
址的对应关系必须完全相同。

1. 首先,确认HMC和每个LPAR中IP地址和主机名的设置。在HMC和每个LPAR中运行hostname命令,
得到HMC和每个LPAR的主机名。

2. 然后在HMC和每个LPAR中运行host 命令检查HMC和每个LPAR中主机名与
IP地址的对应关系是否一致。
如:

在HMC上
> hostname
HMC.company.com
> host HMC.company.com
HMC.company.com has address 9.3.14.199
> host LPAR1.company.com
LPAR1.company.com has address 9.3.14.200
> host LPAR2.company.com
LPAR2.company.com has address 9.3.14.201

在LPAR1上
> hostname
LPAR1.company.com
> host HMC.company.com
HMC.company.com has address 9.3.14.199
> host LPAR1.company.com
LPAR1.company.com has address 9.3.14.200
> host LPAR2.company.com
LPAR2.company.com has address 9.3.14.201


推荐采用/etc/hosts文件而不是用DNS服务器做地址解析,并且在每个分区中(注意不是在HMC上)都存
在/etc/netsvc.conf文件,文件中只包括一行:hosts=local, bind

从新启动RMC
> /usr/sbin/rsct/bin/rmcctrl -z
> /usr/sbin/rsct/bin/rmcctrl -A

四. 可以用如下方法检查设置是否正确。

1. 在HMC上列出分区
> /opt/csm/bin/lsnodes -a Status

partition01 1
partition02 0
partition03 1

以上 1 表明分区是启动的并且被验证为支持DLPAR,0 表示其他。
如果分区已经启动但仍显示0,则需要检查网络和主机名的设置,如果HMC刚刚从新启动则需要等待几
分钟使信息同步。


2.
> lspartition -dlpar
<#0> Partition:<001, partition01.company.com, 9.3.206.300> Active:<1>, OS:,
DCaps:<0xf>, CmdCaps:<0x1, 0x0>

<#1> Partition:<002, partition02.company.com, 9.3.206.300> Active:<0>, OS:,
DCaps:<0xf>, CmdCaps:<0x1, 0x0>

<#2> Partition:<003, partition03.company.com, 9.3.206.300> Active:<0>, OS:<, 5.1F>,
DCaps:<;0x0>, CmdCaps:<0x0, 0x0>

如果所有AIX 5.2的分区都显示Active<1>, ..., DCaps:<0xf>,说明DLPAR的设置是正确的,在上面
的例子中,LPAR 002没有启动,而LPAR 003是AIX 5.1的操作系统。


3. 确保/var文件系统没有100%的占用
用df命令检查/var文件系统,如果100%的被占用,请删除不需要的文件,或扩大/var文件系统,然后
用以下命令修复被破坏的文件:

> rmrsrc -s "Hostname!='t' " IBM.ManagementServer
> /usr/sbin/rsct/bin/rmcctrl -z
> rm /var/ct/cfg/ct_has.thl
> rm /var/ct/cfg/ctrmc.acls
> /usr/sbin/rsct/bin/rmcctrl -A

阅读(3638) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~