Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2587370
  • 博文数量: 323
  • 博客积分: 10211
  • 博客等级: 上将
  • 技术积分: 4934
  • 用 户 组: 普通用户
  • 注册时间: 2006-08-27 14:56
文章分类

全部博文(323)

文章存档

2012年(5)

2011年(3)

2010年(6)

2009年(140)

2008年(169)

分类: Oracle

2008-04-21 00:23:15

配置改变:DARE
当你配置一个群集的时候,配置数据被保存到HACMP指定的ODM对象类中,它存储在默认配置目录(DCD):/etc/es/objrepos
在群集运行的时候有些群集操作(拓扑和资源)是可能被执行的,这些操作就叫做DAREDynamic Automatic Reconfiguration Event)——动态自动重新配置事件。在HACMP V5.1以前,对群集拓扑和群集资源的改变很费时间,因为它需要在群集中运行多个DARE操作。在相同的操作中同时执行对资源和拓扑的动态改变是不可以的。HACMP V5.1允许通过一次动态重新配置操作对资源和拓扑进行改变。
限制:如果在群集中定义了站点,你就不能使用DARE执行对资源和拓扑的改变。这是因为在重新配置的时候远程站点会认为主站点失效,从而初始化接管动作。
DARE操作
动态重新配置需要对群集中所有节点的HACMP ODM类进行改变。
在先前的HACMP版本中,无论何时执行动态配置改变,对每一类的改变都会在群集内部产生多条到其他节点的远程连接。在当前的版本中,因为采用群集通讯架构(clcomdES),到远程节点的连接一直是打开的并被维护为活动,因此,远程操作更快。
在群集启动时,HACMP将自己的ODM类拷贝到一个名为活动配置目录(ACD)的目录中,当群集运行时,HACMP后台进程、脚本和使用工具参考存储在ACD中的ODM数据类。
如果你在运行群集管理器的本地节点上同步群集拓扑或者群集资源定义,这个动作就引发一个DARE事件。
DARE事件中,在所有群集节点的默认配置目录(DCD)的ODM数据被在分段配置目录(Staging Configuration Directory)中初始化DARE事件过程的节点收集。远程节点的HACMP ODM类被收集到本地,然后使用事件戳进行校验和后将其发回远程节点。
执行配置改变后, ODM类被SCD中的内容更新并发回其来源节点。校验和用来避免在多个节点上执行校验、同步群集开始时数据被破坏:如果校验和正确,在目标节点的DCD目录的ODM类就会被更新(覆盖)。
最后一步,ACD中的ODM数据被新数据覆盖;HACMP后台进程被刷新以便新的配置成为活动配置(参考Figure 5-2)。


动态重新配置操作(对资源和拓扑的改变)按以下次序进行:
Ø
释放重新配置所影响的资源
Ø
重新配置拓扑
Ø
获取和重新取得重新配置操作影响到的资源
对群集定义进行改变以前,确认:
Ø
所有群集节点都已经安装了HACMP,且级别相同
Ø
所有节点都可用(启动并运行)而且可以互相通讯。即使在一个群集节点上没有运行群集服务,从其他群集服务活动的节点执行重新配置也是可能的。
注意:在DARE操作时,任何节点都不能被强制停机。这会影响资源组的可用性或者造成数据被破坏。
Ø
群集处于稳定状态;最近没有接收到错误事件或者config_too_long消息。
同步配置改变
当你改变群集拓扑或资源时,HACMP会更新DCD/etc/es/objrepos)中存储的ODM数据。同步会将本地节点DCD中存储的ODM对象类拷贝到其他节点的DCD中。
当同步群集时,DARE事件被触发,HACMP开始校验群集拓扑和群集资源配置的正确性,即使有时候你只对其中之一作了改变。
因为改变拓扑可能会造成群集资源配置无效,作为代替,软件对两者都检查。
动态群集拓扑改变
注意:在HACMP V5.1下,DARE已经改进了对在一个操作中对资源和拓扑改变的支持。
在活动的群集中你可以对群集拓扑作以下改变:
Ø
添加或删除节点
Ø
添加或删除网络接口
Ø
更换网络接口卡(硬件替换)
Ø
改变网络模块调整参数
Ø
添加一个新网络
重要的:为避免资源不必要的处理,我们建议您在改变之前移去改变过程影响到的资源(使用命令clRGmove.
当重新配置一个群集时,HACMP会释放资源组(如果它发现有必要),随后会重新获取它。
在不停止群集服务、使应用离线、或者重新启动节点的情况下,下列拓扑和RG操作不能动态执行:
Ø
拓扑改变
-
改变群集名称
-
改变群集ID
-
改变群集节点名称
-
改变通讯接口属性
-
将一个网络从通过别名的IPAT改变成通过替换的IPAT和对整个网络的改变。
-
改变网络模块的名称
-
添加一个网络接口模块
-
删除一个网络接口模块
-
其他需要完全重新配置RSCT域的改变(拓扑和组服务),因为群集管理依赖于RSCT
Ø
资源改变
-
改变资源组名称
-
改变应用服务器名称
-
改变节点关系
如果因为意外群集事件导致动态重新配置失败,那么,分段配置目录(SCD)依然存在。这可以防止对群集做更进一步的改变。
如果同步过程中一个节点失效,那么,分段配置目录(SCD)不会在所有节点上被清除。
SCD的存在会阻止对群集作更进一步的改变。如果在同步配置结束时SCD没有被清除,这表示DARE操作没有完成;因而SCD扮演着进一步改变的锁。
在改变被群集管理器拷贝到每个节点的ACD之前,你可以观察到DCD被复制到了SCD。如果一个节点的HACMP启动时有一个SCD,它就会被拷贝到ACDSCD被删除,新的ACD被使用。
DARE的任何时间发生一个节点失效,在一些节点上会有“剩余的”SCD,这些SCD必须在HACMP在任何节点上重新启动以前被删除(否则你将要冒不同节点运行不同配置的风险,这会造成一个或多个节点崩溃)。
要恢复这种情况,你必须使用Release Locks Set By Dynamic Reconfiguration SMIT菜单。它会清除保留的SCD并允许进一步的群集同步。如果在任何节点上存在SCD,更进一步的同步都不会执行直到它被删除。
要清除DARE锁定,使用下列过程,从Example 5-1开始:


要释放DARE锁设置,如Example 5-2所示:



等待命令完全成功完成(如Example 5-3)。如果这个操作没有成功,可能需要支持干预,而不能执行进一步的过程。


要使用一步执行相同的操作,你还可以使用以下命令:
/usr/es/sbin/cluster/utilities/cldare -u
阅读(1113) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~