linux学习记录
分类:
2010-08-25 15:01:54
本文总结了与群集资源相关的最重要信息:包括High Availability Extension支持的资源代理类、OCF资源代理的错误代码以及群集对错误代码如何反应、可用的资源选项、资源操作和实例属性。
您需要为添加的每个群集资源定义资源代理应符合的标准。资源代理可抽象化所提供的服务,并为群集提供精确的状态,使群集与它管理的资源无关。当指定启动、停止或监视命令时,群集会依赖资源代理来执行正确的操作。
资源代理通常以壳层脚本的形式提供。High Availability Extension支持以下各种资源代理:
(1)旧版Heartbeat 1资源代理:Heartbeat版本1附带自己的资源代理样式。由于很多用户已根据约定编写了自己的代理,所以同样也支持这些资源代理。但是,建议如有可能请将配置迁移到High Availability OCF RA。
(2)Linux Standards Base (LSB)脚本:LSB资源代理一般由操作系统/分发包提供,并可在/etc/init.d中找到。要想用于群集,这些代理必须遵守LSB规范。例如,它们必须已实现一些操作,至少要包括启动、停止、重新启动、重新装载、强制重新装载和状态。
(3)Open Cluster Framework (OCF)资源代理:OCF RA代理最适合用于High Availability,特别是在您需要主资源或特殊监视功能时。这些代理通常位于/usr/lib/ocf/resource.d/heartbeat/。其功能与LSB脚本的功能相似。但是,它们始终使用环境变量来执行配置,这使它们可以轻松地接受和处理参数。OCF规范包含以下严格定义:操作必须返回退出代码。群集会严格遵守这些规范。
(4)STONITH资源代理:此类仅用于与屏障相关的资源。
随High Availability Extension提供的代理已写入OCF规范。
根据OCF规范,有一些关于操作必须返回的退出代码的严格定义。群集会始终检查返回代码与预期结果是否相符。如果结果与预期值不匹配,则将操作视为失败,并将启动恢复操作。有三种类型的故障恢复:
表1 故障恢复类型
恢复类型 | 描述 | 群集执行的操作 |
软 | 发生临时错误。 | 重启动资源或将它移到新位置。 |
硬 | 发生非临时错误。该错误可能特定于当前节点。 | 将资源移到别处,避免在当前节点上重试该资源。 |
致命 | 发生所有群集节点共有的非临 时错误。这意味着指定了错误的配置。 | 停止资源,避免在任何群集节点上启动该资源。 |
假定将某个操作视为已失败,下表概括了不同的OCF返回代码以及收到相应的错误代码时群集将启动的恢复类型。
表2 OCF返回代码
OCF返回代码 | OCF别名 | 管理员在2009年8月13日编辑了该文章文章。 -->
给主人留下些什么吧!~~
|