分类:
2010-11-08 14:48:13
简介: 服务器的 Firmware 升级和维护是系统管理员重要的日常工作之一,周期性的 Firmware 升级是提高系统稳定性,可用性和功能性的关键内容。本文将针对 IBM POWER6 服务器 Firmware 升级和维护的方法和过程进行详细的阐述。本文的重点将集中在 Firmware 升级和维护的技术实施层面,关于 Firmware 升级和维护的策略以及准则,可参阅文档《IBM System p Firmware / Microcode Service Strategies and Best Practices》,该文档可以从 IBM 公司的网站上下载。
发布日期: 2008 年 7 月 16 日
访问情况 143 次浏览
建议: 0 (添加评论)
IBM POWER 6® 服务器的 Firmware 升级可以通过多种途径来完成,如 HMC、IVM、运行中的 Linux/AIX 操作系统、诊断光盘、系统管理软件 ( 如 IBM Cluster System Management) 等。本文将重点论述使用频率较高的两种方法:HMC 和 IBM Cluster System Management。
IBM Support Download Site 提供了所有 IBM POWER 6® 服务器的 Firmware 下载,从 IBM Support Download Site 下载的 Firmware 文件严格遵守 IBM POWER 6® 服务器的 Firmware 命名规则,也就是说 Firmware 文件名本身就提供了丰富的信息,本节将对 IBM POWER 6® 服务器 Firmware 文件的命名规则进行详尽的说明:
例如,POWER 6® 服务器 9117-MMA 的最新 Firmware 版本为 01EM320_040,可以在 或者
下载到该 Firmware 版本。
Firmware 文件由 15 个字符组成,由两个下划线将文件名分隔为三个字段,我们以通用格式 PPNNSSS_FFF_DDD 为例:
类型描述 | 服务器型号 | 平台识别符 |
---|---|---|
IBM POWER 6® 570 | 9117 | EM |
IBM POWER 6® 520/550 | 8202 | EL |
IBM POWER 6® 575 | 9125 | ES |
IBM POWER 6® 595 | 9119 | EH |
BPA for POWER 6® 575 | 9A00 | EP |
BPA for POWER 6® 595 | 9A01 | EB |
表 1 POWER 6® 服务器平台识别符
进行 IBM POWER 6® 服务器的 Firmware 升级可以通过多种途径如 HMC、IVM、运行中的 Linux/AIX 操作系统、诊断光盘和 IBM 系统管理软件 ( 如 Cluster System Management)。本节将说明用 HMC 和 CSM 进行 Firmware 升级和维护前应该做的准备工作。后面的章节将详细介绍这两种升级方法的详细步骤。
升级方法 | 准备工作 |
---|---|
HMC |
|
CSM |
|
注:所有 IBM POWER 6® 服务器的 Firmware 映像都可以从 IBM Support Download Site 下载。
本节将假设 HMC 对目标服务器的管理功能已经配置完成,也就是说 HMC 已经可以正确管理要进行 Firmware 升级的服务器。如果该配置还没有完成,可参阅 HMC 配置的相关文档。另外,本节将论述的是系统 Firmware 的升级,电源子系统 Firmware 的升级和系统 Firmware 的升级非常类似,唯一的区别是 Firmware 映像不同,系统 Firmware 和电源子系统 Firmware 各自使用单独的 Firmware 映像,对电源子系统的 Firmware 升级在此不做详细的论述。
登录 HMC
POWER 6® HMC 支持 web 方式登录,可以用任意 web 浏览器如 Internet Explorer 或者 Mozilla Firefox 进行登录。
登录方式: ip address or hostname>
检查服务器的当前 Firmware 版本信息
在 HMC 控制界面左侧选中“更新”,进入 Firmware 升级界面,选中目标服务器后,点击服务器名称右上角的 弹出菜单的“查看系统信息”或者屏幕下方的“查看系统信息”,将会显示服务器目前的 Firmware 版本信息,如下图所示:
通过 EC 号中的平台标识符可以得知,该机器类型为 POWER 6® IH 同时配置了 POWER 6® BPA,系统 Firmware 和电源子系统 Firmware 的发布版本为 330,已安装级别,已激活级别和已接受级别均为 14.
确定升级类型
根据现有 Firmware 版本和目标 Firmware 版本之间的关系,Firmware 升级可以分为两种类型:更改当前发行版的许可内码(即修订版本升级)和将许可内码升级到新的发行版(即发布版本升级)。修订版本升级和发布版本升级在操作 上基本类似,只是修订版本升级有可能是并发升级而发布版本升级一定是破坏性升级。以下的论述将以修订版本升级为例因为 IBM POWER 6® 575 到目前为止仅有一个发布版本 330。
确定 Firmware 存储位置
HMC 支持使用多种 Firmware 存储位置来进行 Firmware 升级,包括 IBM 服务 Web 站点、IBM 支持系统、DVD 驱动器、FTP 站点和硬盘驱动器。
如果 HMC 有 Internet 连接,可以:
如果 HMC 没有 Internet 连接,则可以:
升级 Firmware:
在 Firmware 升级就绪检查窗口点击确定后,将会弹出 Firmware 存储位置选择窗口,我们在此选择 FTP 站点。
从上图中我们可以看出,Firmware 升级过程总共用时 64 分钟。
验证 Firmware 版本
当 Firmware 升级完成后,可以使用步骤 2 中描述的方法查看升级后的 Firmware 版本信息,如下图所示:
已安装级别和已激活级别都已经更新为 15,而由于我们尚未进行提交 (Commit),所以已接受级别仍然为 14.
接受新的 Firmware 版本
当确认新的 Firmware 版本工作良好以后,可以将 Firmware 从 T-Side 拷贝到 P-Side,也就是进行接受操作。要进行提交操作,可以在步骤 5-1) 的界面中选中“选择高级功能”后点击确定,会弹出如下的窗口 :
在窗口中选择“接受– 将临时复制到永久”后点击确定即可根据向导的提示进行提交操作。由于当前激活的版本为 T-Side 的 Firmware,所以无法“将永久复制到临时”。
除去新的 Firmware 版本
如果证明新的 Firmware 版本存在问题,我们可以除去新的 Firmware 版本。要进行除去操作,可以在步骤 7 的窗口中选择“除去并激活”即可根据向导的提示进行除去操作。
CSM(Cluster System Management)是 IBM STG(Systems and Technology Group)高性能运算软件协议栈中的集群管理软件。在高性能运算的集群中被广泛应用,用于提供系统管理方案。CSM 提供了完善的对 IBM P 系列服务器的硬件控制功能,其中包括远程电源管理,远程控制台,硬件发现,网卡 MAC 地址收集,Firmware 升级以及分区信息列举等。本文将说明如何利用 CSM 提供的 Firmware 升级功能升级和维护 POWER 6® 服务器的 Firmware。关于 CSM 操作和配置的具体信息,请参考《IBM Cluster Systems Management for AIX and Linux Administration Guide》。
如上节所述,用 HMC 可以完成 POWER 6® 服务器 Firmware 升级维护,但是用 HMC 升级维护 POWER 6® 服务器 Firmware 在易用性方面存在一定的限制,特别是在大规模的集群环境中。CSM 提供了 Firmware 升级维护方面很多易用性改进,只需利用简单的数个 CSM 命令,就可以完成 POWER 6® 服务器 Firmware 的升级和维护。例如,利用 CSM 可以方便地对多个不同类型的 POWER 6® 服务器进行 Firmware 升级或者对一个 HMC 所管理所有服务器同时进行 Firmware 升级。
本节假设在第三节中说明的准备工作已经完成,即目标 HMC 和服务器已经添加为 CSM 集群的管理设备(Managed Device)和管理节点(Managed Node)。并且已经配置从管理服务器(Management Server)到 HMC 的无需密码的 ssh 访问。
检查服务器的当前 Firmware 版本信息
CSM 提供了一个命令 rfwscan 用于获取服务器的 Firmware 版本信息,rfwscan 可以灵活的指定目标服务器的范围,如某个服务器、所有在集群中的服务器、某个或多个 HMC 所管理的所有服务器等。如下用 -c 指定某个 HMC 可以列出该 HMC 所管理的所有服务器的系统 Firmware 和电源子系统 Firmware 信息。
CSMMS # rfwscan -c c180hmc1.clusters.com |
…由于列表过长,此处省去若干行。
将 Firmware 映像复制到 CSM 管理服务器
将已经下载的 Firmware RPM 映像和相应的 xml 文件复制到 CSM 管理服务器,映像文件可以放置在任何目录下。例如,在如下的例子中为 IBM POWER 6® 575 服务器的系统 Firmware。
01ES330_015_015.rpm 01ES330_015_015.xml
用 mkflashfiles 准备升级环境
CSM 提供了一个命令 mkflashfiles 用于确定 Firmware 所适用的平台类型,同时将 Firmware 映像文件复制到相应的目录中。例如:系统会自动将 01ES330_015_015.rpm 和 01ES330_015_015.xml 识别为 IBM POWER 6® 575 服务器的系统 Firmware 并复制到目录 /csminstall/csm/fw/p6_ih/system/update 中。
CSMMS # mkflashfiles -f 01ES330_015_015.rpm
Copying Code Update Package ./01ES330_015_015.rpm to /csminstall/csm/fw/p6_ih/system/update.
CSMMS #
用 rfwflash 升级和维护 Firmware
rfwflash 命令是 CSM 提供的用于 Firmware 升级和维护的最主要的命令,rfwflash 提供了丰富的命令参数用于执行各种 Firmware 升级和维护功能,如 Firmware 升级、Firmware 接受、Firmware 拒绝等,同时 rfwflash 也可以指定灵活的升级目标范围,如某个服务器、所有在集群中的服务器、某个或多个 HMC 所管理的所有服务器等。在此将给出在若干种升级和维护场景中的命令参数,由于命令输出内容较多,在此将不再列出。
rfwflash –n server1 -t system --activate concurrent
如果该升级为破坏性升级,rfwflash 将给出出错信息提示该升级必须为破坏性升级
rfwflash –n server1 -t power --activate disruptive
rfwflash –c c180hmc1 -t system --activate disruptive
rfwflash –a -t power --activate disruptive
rfwflash –c c180hmc1 -t system --activate disruptive --commit
rfwflash –a -t power --activate disruptive --recover
虽然 POWER 6® 服务器与 POWER 5® 服务器在 Firmware 升级与维护的概念、术语和基本过程上保持了延续性,但是 POWER 6® 服务器的 Firmware 升级维护还是与 POWER 5® 服务器的 Firmware 升级维护存在一定的差异。
1. 平台识别符
POWER 5® 系列服务器使用统一的平台识别符,系统 Firmware 的平台识别符为 SF,电源子系统的平台识别符为 BP;与之形成对比的是,POWER 6® 服务器的不同型号使用不同的平台识别符,具体的 POWER 6® 服务器平台识别符可参见表 1 POWER 6® 服务器平台识别符。对于 POWER 6® 服务器的 Firmware update,在从 IBM Support Download Site 上下载 Firmware 映像时应当注意系统识别符,以保证下载的 Firmware 映像对应正确的 POWER 6® 服务器类型。
2. 用户接口
POWER 5® 服务器的 HMC 使用 IBM Web-based System Manager 进行管理,进行 Firmware 升级的用户接口也是通过 IBM Web-based System Manager 提供的,因此在进行 POWER 5® 服务器 Firmware 升级时应先安装并配置 IBM Web-based System Manager,下图为 POWER 5® 服务器 Firmware 升级界面,可以看出与 POWER 6® 服务器 Firmware 升级的界面基本上是相同的;而 POWER 6® 服务器的 HMC 使用 Web 浏览器进行管理,因此在进行 POWER 6® 服务器 Firmware 升级前无需进行额外的系统配置。
本文论述了在使用 HMC 管理 POWER 6® 服务器的场景中如何对 POWER 6® 服务器的 Firmware 进行升级和维护。虽然 IBM 尽力实现 Firmware 升级维护的并发性,但是 Firmware 升级在相当多的情况下仍然是破坏性的,系统管理员需要规划好 Firmware 升级和维护的时间窗口,以免对用户和系统运行造成大的影响。如果在没有 HMC 可以使用的情况下,IBM 也提供了相应的接口对 Firmware 进行升级和维护,但没有 HMC 可用的情况毕竟属于少数,限于本文的篇幅在此不做论述。
学习
获得产品和技术
讨论
李光成 IBM 中国软件开发中心 HPC 部门的软件工程师,主要从事集群系统管理软件的相关研发工作。
曹立是是一名 IBM 中国软件开发中心的软件工程师。从事多年 IBM 集群管理软件 CSM 的测试工作,目前负责 xCat 的测试项目,对 IBM POWER 系列产品和 AIX 拥有丰富的管理经验。
余长勇:IBM 中国软件开发中心 HPC 部门的软件工程师,主要从事集群系统管理软件的相关研发工作。
赵杨:IBM 中国软件开发中心 HPC 部门经理,管理的项目主要有集群系统管理软件和 IBM 并行文件系统 GPFS。
王磊,IBM 中国软件开发中心 HPC 部门的软件工程师,主要从事集群系统管理软件的相关研发工作。