Chinaunix首页 | 论坛 | 博客

nas

  • 博客访问: 647495
  • 博文数量: 456
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 6400
  • 用 户 组: 普通用户
  • 注册时间: 2008-05-08 16:08
文章分类

全部博文(456)

文章存档

2008年(456)

我的朋友

分类: 服务器与存储

2008-05-15 12:02:25

 

ISD HA 定义、特性、资源保护

  ISD HA For NT/WIN2000提供了一个完全容错的软件解决方案,并提供数据、应用程序和通信资源的高度可用性。ISD HA 不需要任何特别的容错硬件。你可以集合使用二个NT/WIN2000结点。并访问特定地点的配置数据。然后,ISD HA会自动地提供错误检测和多层现场恢复。
  在出现故障的情况下,ISD HA会将保护资源自动转换到一个根据优先权而设定的系统。在实际进行切换用户时, 会经历一个十分短暂的休眠,但是,当系统完成了切换操作后,ISD HA会在所选择的系统上自动地恢复操作。

可以被ISD HA保护起来的资源

- 卷(Volume)
- 共享文件
- 应用程序
- 自定义的应用程序

心跳故障检测Heartbeat

  ISD HA在集群节点间保持着间歇的通信信号,也叫做心跳信号,是错误检测的一个机制。即通过每一个通信路径,在两个对等系统之间进行周期性的握手,如果连续没有收到的心跳信号到了一定的数目,ISD HA 就把这条路径标示为失效。
  如果你只定义了一条通信路径,当ISD HA 把这唯一的一条通信路径标为失效时, ISD HA便立即开始恢复过程。然而,如果你有冗余路径, ISD HA能够通过第二条路径确定是系统故障还是只是通信路径有问题。如果ISD HA 开启优先级第二的通信路径并收到了心跳信号,它就不开始failover恢复,只需要把第一条通信路径标成失效,作为信号告诉你需要修理一下有故障的路径。

一般情况下ISD HA 只在下列事件发生时,启动系统恢复功能

- 所有的通信路径故障。如果所有节点都没能收到心跳信号, 把所有通信路径都标为失效,ISD HA 开始安全检查。
- 安全检查失败。当所有通信路径故障时,ISD HA向整个网络发出安全检查信号。如果信号指出配对系统还"活"着的时候,ISD HA 不启动Failover。如果安全检查没从配对节点返回信号,ISD HA 就开始Failover。

因而,为了减少由于潜在的通讯错误所引起的不必要的系统切换,建议您使用不同介质的多条通信路径。

通信路径

ISD HA支持在节点之间和心跳通讯中,使用如下通讯路径:

- Socket 即套接字。你使用任何的网络硬件接口,只要它能够支持TCP/IP的通讯协议。这样的硬件包括:以太网、快速以网、令牌环网以及FDDI 或CDDI 。
- 串行口。 在ISD HA配置中, 你应当配置有一个串行口通信路径。串口通信路径需要利用RS232的拟调解线路来与ISD HA系统相连接。
- ISD HA假定,当通过心跳信号检测其它服务器失败时,则认为此服务器是关闭的

因此,为了避免不必要的失效切换,最好建立两种以上独立的物理路径,使用至少两种心跳。例如,如果两个服务器被一个串口连接起来,并且,从属服务器来的心跳信号无法被主服务器所检测到,则下面之一是可能引起这一现象的原因:
- 服务器的RS-232卡或者端口失效
- 电缆失效
- 主服务器暂时挂起
- 主服务器失效
- 失效切换只可能在最后一种情况下才发生。因此,节点间的多种通信路径可以帮助避免不必要的失效切换。

ISD HA运行机制

HA软件的替换及恢复有:

- Local Recovery(局部恢复)
ISD HA在快速检查(Quickcheck)和深入检查(deepcheck)的时间间隔执行预先定义的行为,以察看资源本身是否失效。如果快速检查和深入检查均局部告失败,系统将尝试局部恢复资源。如果尝试成功,资源将不会向下一优先级的节点进行失效切换(failover )。如果局部恢复尝试失败,系统将向下一优先级的节点进行失效切换。

- Failover(失效切换)
指定主要的节点或资源失败时,重新恢复资源的过程。一个失效切换通常是没有事先计划的,它将发生在一个被从属系统所检测到并确定为失败的情况下。
- Switchover(正常切换)
指用一个有顺序的方式关闭资源,然后将它们恢复到一个备份系统的过程。这通常发生在当你处于维护或者测试模式的情况下。这时,没有任何东西失败。

ISD HA架构图

阅读(507) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~