分类: 服务器与存储
2008-06-13 14:05:19
Case study:7133硬盘故障的判断与处理
举例说明,我们有时候会在AIX系统中用#errpt –aj|more命令查看到有描述为“pdiskx error”,级别显示为“H”类型显示为“P”。该报错的服务器所连接的存储阵列很有可能发生物理硬盘损坏的故障,这时用户可以用以下命令察看7133 RAID的状态。
在AIX系统中用#smitty ssaraid
这时,系统将列出所有定义的SSA RAID阵列的状态(List Status of all Defined SSA RAID Arrays),当RAID中的硬盘出现问题时,此RAID的状态是“degraded”。这时可用以下命令判断硬盘是否被阵列删除:
在AIX系统中用#smit ssaraid
图3
这时,系统将运行列出/标识 SSA物理磁盘(List/Identify SSA Physical Disks),列出删除阵列磁盘(List Rejected Array Disks),如果看到pdiskx被阵列剔除,说明该pdiskx存在物理故障,可采取更换该pdiskx的物理硬盘的办法来解决。
Case Study:从双机热备升级为SAN
目前大部分企业使用7133 磁盘阵列所采用的主要架构为 HA(双机热备) 架构,基本架构为两台IBM 小型机连接一台 IBM 的 7133 磁盘阵列做 HACMP 架构。随着企业应用的不断增长,数据量的不断增加,企业初期配置的存储设备已经远远不能满足用户对性能及存储容量的需求,企业对存储设备的更新迫在眉睫。
为解决企业对容量扩展及对性能提升的需求,因此考虑了升级方案,将企业原有架构中的 7133 磁盘阵列替换为 IBM的 DS 系列光纤磁盘阵列,同时将原来7133 磁盘阵列中的数据平滑安全的迁移到新的 DS 光纤磁盘阵列中,并且在迁移过程中,尽量不中断企业应用。同时考虑到设备利旧问题,将企业原有的 7133 磁盘阵列用作的数据库备份系统,从而提高整体系统的性能。
图4
升级方案一般为IBM DS 系列产品, IBM DS系列最近两年经过了不少升级与换代,现在主流产品为DS4800/DS4700等等4Gb光纤磁盘阵列,兼顾其他DS系列产品,如 4500/4800/6800,使用8口的 SAN 交换机和数据迁移服务软件,可实现平滑迁移用户数据,保持用户日常应用的正常运行。现有 7133 存储设备可以作为数据库备份设备继续使用,因而可保护前期投资,降低未来投入。
图5
整个方案通过提高存储网络性能从而进一步提高整个 IT 系统的整体性能;引进 SAN 光纤交换连接技术,从而提高 IT 系统的灵活性,可以更方便的引进、更新系统;可以支持各种高级的数据备份技术,包括远程拷贝、时间点拷贝等等,简易 GUI 管理,实现资源利用最大化利用。拥有统一的硬件平台,图形化管理更为方便。
作者:谷和启,长期从事于网管,系统运行维护等工作。