分类: 服务器与存储
2008-06-06 06:10:48
理解双机热备,必须要认清这样几点:
1. 对于一台服务器而言,坏的可能总是存在的。故障的原因多种多样,包括硬件、软件、人为故障等,任何一个环节都有可能发生。
2. 服务中断不仅可能发生在管理员在的时候,也可能发生在机房空无一人的时候,而一台跑着应用系统的数据库服务器,并不是很容易就能恢复的。
3. 数据备份当然是重要的数据保护措施,但只是事后的解决方法,无法预防应用停止。
4. RAID只能解决硬盘的问题,解决不了服务器的问题。
当然如果系统中没重要应用,我们没必要考虑双机热备。或者我们可以容忍应用系统停止运行一天,双机系统也并非十分重要。但是,如果应用停上一个小时就会带来严重的问题,那么就无疑应该考虑一下双机系统,而如果业务系统停上十分钟都难以承受,这时候双机热备方案就是必须的了。
双机系统实际上是服务器应用的冗余备份,但是因为通常采用外置磁盘阵列存储数据,因而企业可以更方便集中的对数据进行管理和备份,从而进一步提高整个系统的效率和可用性。当一台服务器上的应用发生故障时,系统可以方便无缝的切换到另外一台服务器,承担起原有该服务器所承担的大部分应用,从而保证业务的不停顿运行。最重要的是,整个切换过程是自动进行的,前端几乎很难察觉到后台的服务器系统的故障。
双机热备系统本身已经是较为稳定的系统,这表现在双机热备系统已经具备了一定的抗风险能力,但是双机热备系统也意味着更复杂的管理、维护和升级工作。因此,在这里,我们通过两台IBM P630小型机和7133磁盘阵列实现双机热备为例,来说明通过HACMP 5.1来实现AIX 5.2的Oracle 9i数据库主从热备系统的运行维护和升级管理工作。