一. 配置DLPAR的要求
建议将HMC (Hardware Management Console) 的版本升级到 Release 3, Level 2.4或以上,可以运 行 hsc version命令来确认版本。LPAR中操作系统的版本需要AIX 5.2或以上版本,并且安装如下软 件包:
rsct.core* csm.client
二. 设置与DLPAR相关的守护进程
1. 检查HMC上守护进程运行的情况 # su - root # lssrc -a Subsystem Group PID Status ctrmc rsct 822 active IBM.DMSRM rsct_rm 906 active IBM.LparCmdRM rsct_rm 901 active
如果以上的守护进程都是active的,则跳到步骤2,如果以上任何守护进程处于inoperative状态,采 用以下命令手工启动它,startsrc -s <进程名>,如: startsrc -s ctrmc。如果进程仍然无法启动, 请与IBM联系。
2. 在每一个需要支持DLPAR的分区中检查AIX的守护进程运行的情况。 > su - root > lssrc -a | grep rsct
Subsystem Group PID Status ctrmc rsct 21044 active IBM.CSMAgentRM rsct_rm 21045 active IBM.ServiceRM rsct_rm 11836 active IBM.DRM rsct_rm 20011 active IBM.HostRM rsct_rm 20012 active
IBM.DRM和IBM.HostRM属于 "lazy started" 进程,它们只在被使用时才处于active状态,如果IBM.DRM 和IBM.HostRM处于inoperative状态,很可能是网络或主机名设置问题,请参阅 三,如果以上进程处于 inoperative状态,用以下命令手工启动它,startsrc -s <进程名>,如:
startsrc -s IBM.CSMAgentRM。
在AIX 5.2 ML2以后的版本中,ctcas也属于 "lazy started" 进程,如果处于inoperative状态,不 需要手工启动。
三. 设置RMC/DLPAR网络和主机名
通常DLPAR的问题都与不正确的设置网络和主机名有关。DLPAR要求在HMC和每个LPAR上主机名与IP地 址的对应关系必须完全相同。
1. 首先,确认HMC和每个LPAR中IP地址和主机名的设置。在HMC和每个LPAR中运行hostname命令, 得到HMC和每个LPAR的主机名。
2. 然后在HMC和每个LPAR中运行host 命令检查HMC和每个LPAR中主机名与 IP地址的对应关系是否一致。 如:
在HMC上 > hostname HMC.company.com > host HMC.company.com HMC.company.com has address 9.3.14.199 > host LPAR1.company.com LPAR1.company.com has address 9.3.14.200 > host LPAR2.company.com LPAR2.company.com has address 9.3.14.201
在LPAR1上 > hostname LPAR1.company.com > host HMC.company.com HMC.company.com has address 9.3.14.199 > host LPAR1.company.com LPAR1.company.com has address 9.3.14.200 > host LPAR2.company.com LPAR2.company.com has address 9.3.14.201
推荐采用/etc/hosts文件而不是用DNS服务器做地址解析,并且在每个分区中(注意不是在HMC上)都存 在/etc/netsvc.conf文件,文件中只包括一行:hosts=local, bind
从新启动RMC > /usr/sbin/rsct/bin/rmcctrl -z > /usr/sbin/rsct/bin/rmcctrl -A
四. 可以用如下方法检查设置是否正确。
1. 在HMC上列出分区 > /opt/csm/bin/lsnodes -a Status
partition01 1 partition02 0 partition03 1
以上 1 表明分区是启动的并且被验证为支持DLPAR,0 表示其他。 如果分区已经启动但仍显示0,则需要检查网络和主机名的设置,如果HMC刚刚从新启动则需要等待几 分钟使信息同步。
2. > lspartition -dlpar <#0> Partition:<001, partition01.company.com, 9.3.206.300> Active:<1>, OS:, DCaps:<0xf>, CmdCaps:<0x1, 0x0>
<#1> Partition:<002, partition02.company.com, 9.3.206.300> Active:<0>, OS:, DCaps:<0xf>, CmdCaps:<0x1, 0x0>
<#2> Partition:<003, partition03.company.com, 9.3.206.300> Active:<0>, OS:<, 5.1F>, DCaps:<;0x0>, CmdCaps:<0x0, 0x0>
如果所有AIX 5.2的分区都显示Active<1>, ..., DCaps:<0xf>,说明DLPAR的设置是正确的,在上面 的例子中,LPAR 002没有启动,而LPAR 003是AIX 5.1的操作系统。
3. 确保/var文件系统没有100%的占用 用df命令检查/var文件系统,如果100%的被占用,请删除不需要的文件,或扩大/var文件系统,然后 用以下命令修复被破坏的文件:
> rmrsrc -s "Hostname!='t' " IBM.ManagementServer > /usr/sbin/rsct/bin/rmcctrl -z > rm /var/ct/cfg/ct_has.thl > rm /var/ct/cfg/ctrmc.acls > /usr/sbin/rsct/bin/rmcctrl -A |