2008年(8065)
分类: 服务器与存储
2008-08-21 11:18:41
使用多路径高可用性(多路径HA)
提示 1:使用多路径高可用性
多路径高可用性为单控制器和双主动模式配置提供存储控制器与磁盘之间的冗余路径。拥有第二条通向存储的路径,就可以在各种潜在故障发生之时予以保护,例如:
在NetApp存储中,如果磁盘发生故障,则会自动触发将受影响的数据奇偶校验重建到热备用磁盘中,前提是假设备用磁盘可用。如果没有备用磁盘可用,则不可能执行自我修复操作。系统将以降级模式运行(通过使用奇偶校验信息重建数据的方式来满足对故障磁盘上的数据请求),直至提供备用磁盘或更换了故障磁盘。在此期间,万一再次发生故障,您的数据丢失的风险大大增加。(如果采用NetApp RAID-DPTM,以降级模式运行的 RAID 组可承受再次发生的磁盘故障,并且数据不会丢失。)
所需的备用盘数量随连接到存储系统的磁盘驱动器数量而变化。对于使用单个磁盘架的较低端 FAS200 或 FAS2000,一个备用磁盘足以满足要求(如果要使用维护中心,则配置两个)。在 FAS6080 上,在 1,176 个磁盘的最大盘数下,需要更多备用磁盘来确保最大的存储弹性,尤其是对于重建时间更长的更大容量的SATA磁盘,更是如此。
NetApp建议为每个磁盘类型(每 100 个磁盘驱动器)使用两个备用磁盘,磁盘类型由唯一的接口类型(FC、SATA 或 SAS)、容量和转速来确定。例如,您有一个系统,系统中包含 28 个 300GB 15K FC 磁盘以及 28 个 144GB 15K FC 磁盘,则应提供四个备用磁盘:两个 300GB 容量,两个 144GB 容量。
以后每添加 84 个磁盘,还应当再分配一个热备盘到备用池。下表提供了一些附加示例来说明此方案。(下表假设所有磁盘的类型相同。)
请注意,如果正在使用 NetApp 维护中心,则至少需要为系统中的每种磁盘类型提供两个备用磁盘。维护中心会对磁盘驱动器执行主动的运行状况监控,当达到某些事件阈值时,它会尝试对可疑磁盘驱动器进行预防性维护。需要两个备用磁盘,可疑磁盘驱动器才能进入维护中心进行诊断。
提示 3:使用SyncMirror提供可能的最大弹性
如果需要的弹性级别甚至高于HA和RAID-DP提供的弹性级别,请考虑使用本地或MetroCluster配置的SyncMirror。
本地SyncMirror提供同一个存储控制器上两个不同传统卷或聚合之间的同步镜像,以确保数据的重复副本存在。自Data ONTAP6.2起此功能可用。SyncMirror 提供的镜像在RAID层保护(V系列中的RAID 4、RAID-DP或 RAID 0)之上。
SyncMirror在两个镜像的存储池(称为丛)之间条带化数据,这样可以改善磁盘负荷的读取性能。它可以在镜像间的多个磁盘同时发生故障时提供更强保护。使用RAID-DP的SyncMirror 的容错能力很强,它可在镜像的RAID组中有多达五个磁盘同时发生故障时仍确保数据的可用性。由于SyncMirror 采用本机 NetApp SnapshotTM 技术来维护同步的检查点,在与一个丛的连接丢失之后重新同步所花费的时间将更少。只有在最新的Snapshot检查点之后更改过的数据才需要同步。
如果与 MetroCluster配合使用,SyncMirror还提供地理灾害的容灾能力。SyncMirror需要作为MetroCluster的一部分,才能确保在源数据中心不可用时,远程数据中心中仍存在一份相同的数据副本。如果在主动/主动模式配置中使用,SyncMirror可提供最高的弹性级别,以确保数据持续可用。
提示 4:有效使用HA配置,以实现不间断升级
配置存储系统具有主动/主动存储控制器的HA架构,是消除单点故障和提高弹性的好方法。除消除潜在的计划外停机时间之外,这些配置还可以减少在不间断升级期间的计划停机时间。
不间断升级 (NDU)使您可以通过执行滚动升级,在尽可能不中断客户端数据访问的情况下透明地升级主动/主动存储系统中的任何组件(软件、磁盘和磁盘架固件、硬件组件等)。为执行不间断升级,开始之时应从各项因素(包括许可证、网络访问和配置的协议)确定两个存储控制器是相同的。您可以从中了解关于 NDU 的更多信息。
确保升级顺畅进行的最佳做法是预先妥善检查系统,以确保系统符合NDU要求。如果符合这些要求,则还应确保HA系统采用优化配置,以提供可能的最大弹性和数据可用性。NetApp提供了一组自动化工具使此想法成为可能,如下节所述。
提示 5:使用自动化工具验证存储配置
不管是采用群集的HA存储系统还是单控制器配置,特别是在升级之前,请务必确保安装的硬件、固件和软件是正确的。您可能有数十个磁盘架和数百或数千个磁盘,此任务可不是小菜一碟。幸运的是,NetApp全球服务 (NGS) 开发了一组工具以将这些流程自动化,否则这可真是一件乏味而易出错的工作。定期运行这些工具可以提高存储系统的弹性并简化操作。
群集配置检查程序 (Cluster Configuration Checker)
此工具将检测并找出故障转移问题的最常见配置原因:
升级顾问 (Upgrade Advisor)
升级顾问设计为一次性解决方案,以使存储系统符合 Data ONTAP 升级要求。此工具使用实时的 AutoSupport 数据,首先将确定系统合格相关的每条警告和要求的过程(通常是一个痛苦的手工过程)自动化,然后生成逐步升级计划,以在升级和停止升级时使用。
升级顾问的公共版本通过Premium AutoSupport界面向客户提供,后者在购买SupportEdge Premium时已包括在内。其他客户可通过NGS或NetApp专业服务,间接使用升级顾问让他们的环境符合要求。
总结:
除非太迟,否则请勿认为存储系统理所当然是有弹性的。采取本文所述的一些前瞻性步骤,可以进一步提高存储系统的弹性。多路径HA消除了至后端存储的单点故障,有助于改进性能的一致性。配置合适的备用盘数可确保当磁盘发生故障时立即开始磁盘重建,限制无保护风险。SyncMirror 为关键数据操作提供可能的最大弹性。NDU 减少或消除了升级和增强期间的计划停机时间,使用自动化工具的定期系统验证可确保配置正确无误,同时简化升级规划。