分类: 服务器与存储
2008-06-07 16:51:12
概念
、什么是双机热备
双机热备这一概念包括了广义与狭义两种意义。
从广义上讲,就是对于重要的服务,使用两台服务器,互相备份,共同执行同一服务。当一台服务器出现故障时,可以由另一台服务器承担服务任务,从而在不需要人工干预的情况下,自动保证系统能持续提供服务。
双机热备由备用的服务器解决了在主服务器故障时服务不中断的问题。但在实际应用中,可能会出现多台服务器的情况,即服务器集群。
双机热备一般情况下需要有共享的存储设备。但某些情况下也可以使用两台独立的服务器。
实现双机热备,需要通过专业的集群软件或双机软件
从狭义上讲,双机热备特指基于active/standby方式的服务器热备。服务器数据包括数据库数据同时往两台或多台服务器写,或者使用一个共享的存储设备。在同一时间内只有一台服务器运行。当其中运行着的一台服务器出现故障无法启动时,另一台备份服务器会通过软件诊测(一般是通过心跳诊断)将standby机器激活,保证应用在短时间内完全恢复正常使用。
2、为什么要做双机热备
双机热备针对的是服务器的故障。
服务器的故障可能由各种原因引起,如设备故障、操作系统故障、软件系统故障等等。一般地讲,在技术人员在现场的情况下,恢复服务器正常可能需要10分钟、几小时甚至几天。从实际经验上看,除非是简单地重启服务器(可能隐患仍然存在),否则往往需要几个小时以上。而如果技术人员不在现场,则恢复服务的时间就更长了。
而对于一些重要系统而言,用户是很难忍受这样长时间的服务中断的。因此,就需要通过双机热备,来避免长时间的服务中断,保证系统长期、可靠的服务。
决定是否使用双机热备,正确的方法是要分析一下系统的重要性以及对服务中断的容忍程度,以此决定是否使用双机热备。即,你的用户能容忍多长时间恢复服务,如果服务不能恢复会造成多大的影响。
在考虑双机热备时,需要注意,一般意义上的双机热备都会有一个切换过程,这个切换过程可能是一分钟左右。在切换过程中,服务是有可能短时间中断的。但是,当切换完成后,服务将正常恢复。因此,双机热备不是无缝、不中断的,但它能够保证在出现系统故障时,能够很快恢复正常的服务,业务不致受到影响。而如果没有双机热备,则一旦出现服务器故障,可能会出现几个小时的服务中断,对业务的影响就可能会很严重。
另有一点需要强调,即服务器的故障与交换机、存储设备的故障不同,其概念要高得多。原因在于服务器是比交换机、存储设备复杂得多的设备,同时也是既包括硬件、也包括操作系统、应用软件系统的复杂系统。不仅设备故障可能引起服务中断,而且软件方面的问题也可能导致服务器不能正常工作。
方案设计
、现状分析
目前,温州海事局业务系统在运行中采用的是单服务器使用,以运行数据库为主要应用,提供整个海事业务及相关专业软件数据服务。
由于没有专有存储设备,所有的文件以及数据都是存放在服务器自身所配置的内置硬盘。对于在应用刚开始的初始阶段,数据量还不多的情况下这种方式还基本能满足需求。但是,随着企业规模与业务量的增长、科技水平的发展在这种传统的结构中,逐渐暴露出了一些缺陷,并且不具备很好的扩展性,同时使得数据处于危险的无保护状态;所有的数据都存放在服务器内部,如果该服务器发生故障或宕机或停机升级,就会造成数据呈离线状态,无法实现业务的连续性,我们称之为信息孤岛;由于使用的是服务器内部的硬盘空间,各个服务器之间的存储空间资源无法调配共享,并进行再分配。如果通过以太网来进行空间共享的话会存在加大服务器负担、连接传输速度得不到稳定的保障、需要得到应用程序的完全支持等困难问题。
、方案目标
本方案总体目标是通过合理、科学的分析,对温州海事局现有系统进行整合优化,力求构建一个科学、先进、安全的数据应用安全体系。最终应达到如下设计目标:
实现数据的集中存储,统一管理;
提高设备的利用率,保护原有投资;
服务器、业务系统的整体高可靠性环境构建;
关键服务器数据的统一规划管理;
避免人为操作造成的不确定因素;
选择性能/价格比最优的解决方案;
最大化的解决数据安全隐患,提升用户系统管理级别;
系统防御灾难、事故、意外的综合能力强;
、方案设计原则
具体设计中,为实现整个方案的各项目标,同时须根据一些基本原则,这将使目标的实现更有保证。系统设计遵循以下原则:
(1)、实用性
根据用户现有系统的实际情况,面向业务安全和管理,满足用户的需求。并且根据我公司在该领域的经验,提出合理性建议及今后的发展规划。
本方案具有非常好的实用性,整个系统平台较为统一(微软的操作系统环境),应用系统较多,对它们进行统一的存储管理是必须的,通过网络,将相关的数据库、应用数据集中存放在SAN构架下、通过多机集群,保证在任意系统发生故障时,能够以最快的方式恢复业务运作。
(2)、技术先进性
选择目前业界最成熟的先进技术,根据用户的情况,合理配置,通过优化方案节省建设资金。
方案采用了目前主流、领先的SAN构架、多点集群方式,通过高可靠性的磁盘阵列系统实现整个系统的多层次保护,也提高了整体性能和数据存放的安全性。采用的是性价比优良的存储系统和联鼎多机集群。是一个具有多重技术优势的整体解决方案。
(3)、可靠性
选择的设备和软件应有良好的声誉及可靠性,选择的方案充分考虑可靠性原则,避免各种不确定因素造成的损失。
我们通过SAN构架集中存放关键数据、多点集群保证高可用,使系统整个达到高可靠。
可以在后面方案中看到,整个系统数据安全分为三个层面:
存储构架的合理保护,通过FC 存储构建的SAN环境,使得任何服务器的关键数据都能在RAID的保护之下;
LanderCluster实现的系统层面的高可用安全保障,可以通过多节点集群,对故障业务进行重组,保证能够持续的提供服务。
(4)、保护投资和系统伸缩性
能充分利用现有数据存储设备和网络环境;利用现有设备的一切可利用资源。
本方案具有非常好的性能价格比,相对其它任何解决方案,都具有投资少、安全系数高的特点。
对于SAN构架,通过存储改造,系统在SAN环境下时,存储及服务器的扩展就变得如同在网络中增加一个工作站一样容易。
(5)、精心实施原则
考虑到完成建议书的时间较短及与用户交流的次数较少,因此本建议的很多推论可能有不当之处。按照本建议的说明,很多原则也待讨论细化。因此实施前应先组织用户培训及与相关人员细化实施方案,通过多方的结合和配合,使系统建设达到更高的水平。
、方案部署
、 方案说明
从用户的需求来看,整个服务器存储系统硬件平台的主要要求是:高可用性、运行性能较高并且平滑的可扩充性、采用工业标准的开放性、以及可维护性、简易性等方面。
因此,系统设计的出发点基于以下几点考虑:
1) 实用性:
系统设计充分满足目前的业务需求,并充分考虑到未来业务发展的需要。
2) 先进性:
采用现在最先进的技术,如光纤存储产品,存储局域网等等。
3) 高性能:
存储系统处理能力能够充分胜任业务处理的要求及信息量不断增长的挑战,满足各种应用对硬件平台在大数据量、高反应速度条件下有良好的性能的要求,并支持多机并行运行,性能线性增长。
4) 安全性:
采用当前先进的和流行的安全技术保障系统在网络服务和应用服务上的整体安全性。
5) 可扩展性:
方案中充分考虑未来业务发展的需要,留出足够的扩展空间。在系统扩充过程中,业务能够不间断。
6) 开放性:
向用户提供要能符合国际标准,支持各种主流厂商的产品。
在方案中主要是两台服务器和一个磁盘阵列,其中两台服务器分别作为主从服务器,主服务器是温州海事局原有的HP DL570服务器,从服务器是新买的HP DL380服务器,然后在操作系统、业务软件及数据库配置方面都是一样的,然后两台服务器后面通过SCIS线同时接HP MSA500磁盘阵列,这样就达到温州海事局业务软件数据的集中存储,统一管理。两台服务器通过一条心跳线连接,然后通过双机软件实现真正意义上的双机热备系统,这样温州海事局在平时的业务系统应该的时候,如果主服务器因软件或是硬盘上的问题导致不能正常提供业务应用服务的时候,从服务器就会自动识别,并且在几秒之内自动代替主服务器,进行提供业务应用的服务,保证温州海事局业务系统应用的不间断性,使得海事局的业务工作不受影响。