Chinaunix首页 | 论坛 | 博客
  • 博客访问: 11602139
  • 博文数量: 8065
  • 博客积分: 10002
  • 博客等级: 中将
  • 技术积分: 96708
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-16 17:06
文章分类

全部博文(8065)

文章存档

2008年(8065)

分类: 服务器与存储

2008-07-30 13:54:56

美国Legato公司是企业级网络数据存储和保护的领导者。作为美国存储业领导厂商 ――EMC公司的一个独立的软件部门,Legato提供给用户既高效又方便的解决方案。因此,为我们的用户提供在Windows,Linux和UNIX平台上的、全面的数据保护管理领域的优秀的软件系列产品,是用户能实现跨平台、跨系统的网络数据存储及保护功能,以期简化用户系统管理,实现网络数据自动化管理,是Legato一直以来的任务。Legato 的目标是向用户提供真正有价值的网络数据管理一体化产品,使基于网络的企业级数据管理更加简易,包括各种桌面系统和服务器,各种各样的磁盘阵列。

    AutoStart(原名为业界久负盛名的AutoStart和Co-StandbyServer产品)是一个基于Windows NT/2000, Solaris, HP-UX, AIX, Linux服务器的高可用性群集解决方案。

失效切换的重要性

    主机的故障性停机将对应用程序的正常运作造成很大影响。 尽量减少Downtime(故障停机时间)是十分必要的。

系统故障原因:

§服务器电源中断

§无法修补的应用程序故障

§数据库故障

§系统出现超载运行

§网络资源故障

§关键性操作系统程序出现故障

§人为错误

§自然灾难

系统故障带来负面影响及问题:

§系统及硬件供应商不能提供即时技术支持

§不能估计系统恢复时间

§浪费时间解决故障,影响生产力

§客户或管理阶层对公司失去信心

§公司形象受到负面影响

 

高可用性带来的好处:

§保证系统上的数据、服务及应用的连续性及可达性

§减低系统故障带来的影响

§减低客户机/服务器架构的维护成本

§避免单点故障

    在服务器发生故障时,虽可人工地进行数据恢复和后备服务器的切换启动,但整个过程所需时间的长短在很大程度上取决于当时的故障复杂程度和系统管理人员的技术水平等等。人为因素很多,难以保证很快恢复系统运行。

    Clustering技术是将多台服务器联在一起,组成一个高度透明的大型系统,让最终用户能共享网络上的所有资源,如数据或应用软件等。当其中任何一台服务器出现故障时,另外的服务器便立即自动取代该故障机器的职责,继续为用户提供服务。

[next]

二、AutoStart概论
 

    现在您可以消除因为关键性应用及通讯中断所带来的损失。AutoStart 是新一代群集软件,它可以对应用程序进行监视、修复、重新启动和故障排除,从而为用户的系统提供前所未有的保护,保证系统上的应用程序、数据和网络资源不会受到任何外在因素影响而中断服务。

    AutoStart 所独有的恢复应用程序特性,能及时地切换故障应用程序到其他指定的服务器上。除了能保证故障应用的可用性外,还确保了原服务器的其它应用程序不受故障和切换影响而继续运行。另外,创新的Peer-to-Peer结构,能群集多达一百台服务器,共同组成一个强大而灵活的群集组。

三、AutoStart 构造及工作原理
 

模块设计,集灵活和易用于一体,使你仅需配置所需要的部分。

§ AutoStart群集管理控制台担当联系通信、监视系统资源的任务程序提供健全服务,共享群集组的状态信息。

§  AutoStart环境软件控制台将提供直观的安装和灵活的集成,并监视重要系统资源。通过AutoStart环境控制台,可扩展AutoStart 基本功能,使它支持不同品牌的管理程序、网络协议、文件系统及各类RAID的产品。

§  AutoStart模块通过AutoStart的模块,客户能有效地管理系统的各部分,以提供高可用性支持。此外,它能配合AutoStart 环境控制台,并透过AutoStart 命令中心进行监视,管理控制。AutoStart 支持几乎所有的数据库管理、监控和切换,应用模块包括: 

  •  MSSQL 

  • Exchange 

  • Sybase
  • Oracle
  • Informix
  • IIS 4.0
  • EMC SRDF
  • Checkpoint Firewall-1
  • Encina
  • Tivoli
  • Web
  • NetWorker
  • NFS

     

    如果是用户自己开发的应用,只需编写一个很简单的脚本就可以实现高可用性管理了。

    §   AutoStart 的切换的一般程序:

    ?C检测以确认需要切换

    ?C停止相关应用

    ?C释放相关资源

    ?C文件系统同步

    ?C备用机获取相关资源

    ?C启动相关应用及网络通道

    §   AutoStart 支持的网络环境包括:

    ?CEthernet

    ?CFast Ethernet

    ?CFDDI

    ?CCDDI

    ?CATM

    §    AutoStart 支持所有至少双口的磁盘,包括:

    ?CSPARC Storage Array

    ?CStorage Dimensions

    ?CNetApp

    ?CEMC Symmetrix, Clariion, FCxx, IPxx,

    ?CSun A5X00, A1000, D1000, T3

    ?CRSM2000

    ?CMultipack, Unipack

    ?CDEC

    ?CAll two Channel SCSI

     §  Legaot AutoStart 支持File Systems 及 Volume Managers

    ?CNFS ver 2 and ver 3

    ?CJournaling File Systems

    ?CSun Solstice Disksuite

    ?CVeritas VxFS

    ?CVeritas VxVM

    ?CUFS[next]

  • 四、AutoStart 高可用性群集系统关键特性
     

  •    AutoStart以下几方面的关键技术可以提供用户系统强大的可用性,可管理性和扩展性:

    AutoStart支持多达100台服务器的群集组合,AutoStart能按客户发展需求,增加AutoStart群集服务器及所载应用程序数量;提供故障监察、修复、重新启动及排除故障功能;能单独修复个别故障应用,缩短系统复原时间;动态负载调节,确保故障出现时,应用程序能平均地分布在不同服务器上;灵活、可靠、可调的群集构造,为日后扩展作好充分的准备;模块构造和开放式APIs与现在系统的各个环节配合,确保端对端可靠性;协同数据库及RDBMS数据备份服务器;提供中央管理,监察群集组内不同的UNIX平台。

    高性能的系统和应用的高可用性针对任何需保护的应用,无须改变应用配置。AutoStart提供功能及相应的技术包括:

    §   单一系统映象(SingleSystem Images)。即将整个集群环境中的资源视为一个整体。AutoStart使用单一的配置数据库(复制多份以避免单点失效)、统一的管理规则和集中的应用脚本将整个系统中的资源形成一个资源集,或者说将整个分布式系统形成一个系统。由此带来了更高的资源可用性和更简便的管理和使用。

    §   SAN-Ready。AutoStart对集群内的主机数量没有限制,并提供多TCP/IP连接、独立网络检测、通过FibreCable或SAN的通信和利用磁盘作为通道等多种方式进行心跳侦测和通信。因此可工作在包括SAN在内的多种网络结构中。与SAN的良好结合可提供SAN用户更高的应用和数据可用性,使用户的SAN环境发挥最大的功效。

    §    Adaptive Computing Environment: AutoStart 可以通过所提供的“events “ 和“rules “引擎来感应计算机事件。这些事件可以发生在应用,数据,系统和网络上面,可以是计划内也可以是突发性系统故障。 AutoStart 可以对这些事件做出适应性反应,引发另外一些“解决性动作”来保证系统上资源的获得性。

    §   智能式监测及恢复: AutoStart使用智能式决策过程来检测和恢复服务器和应用程序的故障(能检查的故障包括, 应用程序、网口失效或磁盘控制器) 。当检测出故障时,AutoStart能精确地计算出群集组内哪个服务器最适合接管故障应用程序,并确保只有哪些出现故障的部分才被转移,避免对其它正常运行的程序造成混乱。

    §    负载均衡: AutoStart群集管理功能为独立的应用程序、数据库、RAID磁盘阵列或其它贯穿AutoStart群集组的重要资源提供 “故障负载平衡”。 当服务器出现故障时,AutoStart能平均地把应用程序按设定分布在不同的群集服务器上,避免单台服务器出现超载情况,减低用户的效率。

    §     跨平台群集: AutoStart 能支持多达100台服务器的群集组合,并能监视群集内每个应用程序的运作。支持NT/2000和Linux。整个企业可采用一个群集方案来管理。目前支持的平台有Sun Solaris, Windows NT/2000, HA-UX, IBM AIX, Linux Red Hat。此外,“Peer?Cto-Peer”的群集结构避免了不必要服务器及硬件配置而造成的额外开支。AutoStart“开放式”及“非干预式”设计,使它能支持不同操作系统包括UNIX及NT平台,也能支持不同的数据库和磁盘阵列等系统配置。异构平台集群将企业系统环境中由于平台不一致而相分隔的资源结合成为整体。由此带来更大的资源共享能力和整个系统的服务级可用性。

    §    可调性和可扩容性:利用AutoStart,可以先从两个服务器,单个磁盘开始,然后根据个别企业的需求增长,再增加配置。AutoStart模块配置将为数据库,网络服务器和其它服务器提供可调和可扩容性的功能。

    §    面向应用的群集及自动切换:AutoStart面向应用的集群技术,保证了集群中的任何一个服务器在作为某一应用主服务器的同时,可以作为运行于其它服务器中应用的后备服务器。在这样的结构下,集群内运行的关键性应用在故障不断发生的情况下,仍可以通过服务器之间连续的切换,保证应用的连续性。

    §    应用程序的恢复: AutoStart同时提供单故障应用程序切换及服务器切换。当服务器或应用程序出现故障时,AutoStart立即切换故障的服务组到其它服务器上,使原服务器及其它的应用程序得以继续运行而不受影响,回忆系统复原所需的时间。

    §    中央管理、方便使用: AutoStart的命令中心提供一个由JAVA编写的图形用户界面(GUI),让用户轻松地管理群集组内部服务器及所载的应用程序。这不但能以生动形式显示群集组内各服务器,服务组及应用程序的情况,也能监察在其它地区运行的AutoStart。Legato的SNMP模块更能兼容其它SNMP配置集成,保障了对网络管理的投资,改善系统的管理能力和降低管理成本。

    §     模块,开放式结构和APIs:AutoStart开放式结构及为特殊应用程序编写的各种模块,让您能因应信息环境需求,与AutoStart天衣无缝地集成起来。例如,连接不同数据库如Oracle, Sybase, Informix模块,配合特殊关键应用模块,如Web Server, NFS,Firewall,LotusNotes及AutoClient等等。客户更能通过AutoStart提供的API把附加的应用程序及其它关键性资源归纳在群集组中。通过AutoStart管理控制台进行检测及监视,当检测出应用程序发生故障时,AutoStart将竭力在本地网络对它们进行恢复或确定群集组中最佳服务器接管这个负载。AutoStart被验证明能与各种RAID产品集成及支持多种网络技术。[next]

  • 五、AutoStart工作应用
     

    ?  服务器(Server): 在高可用性(Cluster)环境中,服务器出现故障是由集群中其它服务器做后备的。当服务器发生故障时,该服务器上的应用将转移到有最高优先级的其它备份服务器上。

    ?  网络(Network): 尽管服务器的状态稳定,但网络发生故障对于客户的访问同样是非常致命的。每台机器拥有备份的应用网络接口可以预防网络故障。拥有备份的应用网络接口,系统可以提供故障检测和自动切换,在主要网络发生故障时自动切换到同一台服务器上的备份网络上。客户的访问是透明的。基于同样的想法,AutoStart使用两个心跳网络。

    ?  引导盘(Boot Drive)和镜像盘(Mirrored Disks):Windows 2000必须安装在非镜像数据所在的一个分区。无论如何划分,Windows 2000所在的系统分区不能被镜像。而该磁盘上的其它分区可以被镜像。稍后将详细讨论。AutoStart支持所有的硬盘控制器和所有与Microsoft Windows 2000兼容的存储设备。包括SCSI、IDE、SSA、RAID和其它形式。

    资源镜像Resource Mirroring

    AutoStart比只复制文件和目录的软件更加强大,服务器所有的身份和功能都能够被镜像,包括:磁盘、IP地址、共享、打印队列、甚至应用程序。服务器资源的类型决定了复制的方法。这些方法包括:

    1)    为管理磁盘/分区做磁盘/分区镜像。

    2)    为管理应用做注册表的保护。

    3)    为IP地址、服务器名、打印机和共享做内置应用程序接口(APIs)。

    磁盘/分区镜像Disk/Partition Mirroring(仅限于Windows平台)

         AutoStart提供了一个全新的磁盘镜像引擎,从而避免需要一个独立的物理磁盘。早期的的版本要求每个服务器至少需要两个或三个物理磁盘来完成一个主/从或主/主方式的配置。新的镜像引擎允许单独地管理或镜像一个磁盘上的多个分区。

        当一个Windows 2000卷作为一个被管理资源进行配置时,该镜像引擎就被调用。每一个在被管理分区上的数据块都被镜像/复制到镜像对儿的另一个磁盘设备上。这一过程很像在一个服务器内部的磁盘复制,只不过镜像对儿中的磁盘分别在不同的服务器上。当镜像对儿中每个磁盘设备上所有的数据块同步之后,该镜像对儿被认为是健康的(Health)。当镜像对儿是健康状态时,对于关键任务数据的访问有两条途径。首先,每个集群服务器都有一份最新的数据拷贝。如果网络上的用户突然失去了对集群中一个服务器的访问,失效切换进程将把失效服务器身份切换到存活服务器上。允许用户重新获得对镜像数据的访问。第二,在镜像对儿中,因为两个Windows 2000分区是以数据块级的镜像被复制到两个磁盘驱动器中,它被操作系统当作一个分区对待。如果一个服务器上的I/O卡或磁盘驱动器失效,对于数据的访问不会发生任何事情。因为在镜像对儿中还有一个激活的I/O卡或磁盘驱动器存在。就像在单个服务器的内部进行磁盘复制一样,其中一个失效不会有任何影响,用户还可以从镜像对儿中存活的驱动器上访问数据。(类似于RAID 1)

       新的AutoStart镜像过程不要求操作系统在定义或重定义一个镜相对儿后重新启动。AutoStart用它自己的过滤驱动程序通过Legato Remote Management Console镜像驱动器。该驱动程序总是被加载的,所以,对于镜像对儿的任何改变,用户无需重启。

    ?   文件系统(FileSystem): 当执行许多文件操作时(建立/插入/更新),服务器发生故障会造成许多文件/文件系统更新的丢失。因此,在系统重新启动恢复时,文件系统的重新检测是一定要做的。FSCK对于文件系统的修复是必须的,其时间会根据更新文件的数目和大小而变化。这种修复非常花费时间。因此建议使用?e的文件系统(e.g.VxFS)。?@不仅能快速恢复一个错误的文件系统,而且它通过使用自己的日志文件,在不需要人工干预下就可以保证数据文件的一致性。不管文件系统的大小和数目,系统都可以做到快速完成文件系统的检测。

    ?   应用(Application): 应用(Application)在高可用性(Cluster)环境中是做为一个服务存在的,服务的失败可以被独立处理,切换到集群内其它最合适的服务器上并且不会影响到本服务器上其它服务的运行。对那些IP不相关的应用,仅仅应用数据需要切换,而在IP相关的应用中,相关的IP地址也需要切换。根据应用的重要性,应用可以有选择地被切换到别的机器上,如果应用中的某一个发生错误,那些与它共享一个IP地址的应用也需要被切换。如果那些共享一个IP地址的应用需要分别的切换,那么每个应用都应有一个独立的IP地址。[next]

    六、AutoStart 功能模块及组件介绍
      1.   AutoStart Modules

    Legato Cluster可以保护任何应用,但是对于一些常见的应用可以提供更高的管理能力以使应用的性能达到最佳。

    AutoStart 应用模块目前有:Oracle, Sybase, Informix, NFS, Networker, Web , Apache, Gauntlet Firewall, Checkpoing Firewall, Encina, IIS, 和EMC SRDF。

      2 .   AutoStart Firewall

    有两个版本的AutoStart Firewall作为保护防火墙的解决方案

    主要特点为:

    提供防火墙应用的自动切换,并重新配置IP地址、主机名及其他与防火墙应用相关的资源;

    集中的管理和控制

    可与AutoStart配合实现企业整个环境的集群

    * AutoStart Firewall for PGP/NAI Gauntlet; 包括AutoStartE(Enabled with Deptkey); AutoStart Firewall for PGP/NAI Gauntlet;

    * AutoStart Firewall for Checkpoint Firewall-I: 包括AutoStart(Enabled with Dept key); AutoStart Modules for Checkpoint Firewall-I

      3.   Legato eAutoStart

    LegatoeAutoStart是保护那些需要与CiscoLocalDirector或者其他工作负载平衡方案,诸如:F5、Resonate或者Microsoft解决方案一起运行的Web服务器的解决方案。

        特点:

        在不影响Web服务性能的情况下提供系统24x7的可用性;

       可监控CPU负载、响应时间等影响系统性能的关键因素;

       可与Legato Cluster Firewall结合,形成完整体系;

    集中的控制台

    Legato eAutoStart组件包括:

         *   AutoStart Enterprise;

         *   AutoStart Modules for IIS;

         *   AutoStart Toolkit for Web(HTTP监控)

         *   AutoStart Toolkit for Apache Web Service

    Legato wanAutoStart

    Legato wanAutoStart广域网应用保护方案,提供将应用从一个地点移到另一个地点,跨地域保护的灾难恢复方案,以预防地震、火灾或人为操作等造成的对业务的影响。

     特点:

          采用Legato远程数据镜像技术或与EMC SRDF集成,提供远程应用快速自动切换和数据可用性;

          无距离限制;

          管理简便。

          可与用户自定的数据镜像技术集成

     系统支持:

          Solaris 2.6,7,8

          HP-UX10,20或11.x

          Windows NT/2000

          EMC Symmetrix 及SRDF

    七、应用系统方案
    根据客户的需求,两台IBM Server通过SCSI口与1个ADTX StorEdge磁盘阵列连接。

    Legato Cluster需求:每台 IBM Server 内配置4个Ethernet网口,系统配置TCP/IP。

    1、其中两个Ethernet口接Private network作为HeartBeat线,这些HeartBeat 线通过交叉线对接。Heartbeat组成为 IBM Server 间的私用网,用于相互监视对方的健康状况。(为更加安全可靠,Heartbeat 线留有备份Heartbeat 2,当一条线有故障时,另一条可继续提供服务)。

    2、其余单机上的两个Ethernet网口可配置为互为备份,接在Public Network 上。Cluster系统的关键在于消除“单点故障”(Single Point of Failure),即保证不会出现因一个部件失效而造成整个系统瘫塌的情况。

    3、Cluster系统中每一个部件都留有冗余备份,包括主机、网卡、网络、应用软件、存储设备 (DiskArray)。一旦某个部件出现问题,冗余部件会自动接管工作,从而消除故障对整个系统的影响。在正常情况下,两台 IBM Server 各自为用户提供相应的服务,当一台服务器有故障时,它所提供的服务会按照预定的优先级切换到其它机器上。那两个互为备份接Public network 的网口,在正常情况下只有一个在工作,当出故障时,另外一个将接替其工作。

    4、AutoStart提供对Netscape Enterprise Server、Oracle、Sybase、Informix、CheckPoint Firewall,Web以及用户应用的高可用性的支持。

    5、在正常情况下,每台 IBM Server 运行各自的Application, 每个Application对应相应的网络客户、文件系统及应用;当一台 IBM Server 故障发生时,可以在较短的时间内将相应的网络、文件系统及应用切换到另外一台主机上,在性能足够的情况下,并不影响对方主机的其他应用正常运行

  • 阅读(1290) | 评论(0) | 转发(0) |
    给主人留下些什么吧!~~