容灾设计真实案例分析-copyking-ChinaUnix博客

存储知识库mssxw.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

copyking

博客访问： 11852125
博文数量： 8065
博客积分： 10002
博客等级：中将
技术积分： 96708
用户组：普通用户
注册时间： 2008-04-16 17:06

文章分类

全部博文（8065）

存储学院（0）
归档/备份/容灾（238）
虚拟存储（324）
SAS/NAS（104）
磁盘（224）
RAID（62）
ISCSI（75）
存储管理（158）
存储网络（252）
未分类文章（1305）
未分配的博文（5323）

文章存档

2008年（8065）

我的朋友

相关博文

容灾设计真实案例分析

分类：服务器与存储

2008-07-17 14:08:31

DR（Disaster Recovery）系统容灾和BC（Business Continuity）业务连续性解决方案是业界基础架构Infrastructure方面的一个主要解决方案，各大存储硬件和软件公司都有自己的解决方案，总的来说，分为基于存储、服务器、以及软件应用三种方式或者相互组合。因为通常来说，容灾解决方案都会在业务系统已经投入运行一段时间后，由于重要性的不断增加才提上日程，所以建设一个容灾系统必须完善地考虑对现有系统的综合影响，仔细设计，否则会产生各种各样的麻烦和困难。下面就和大家分享一个真实的案例。

客户是一家在全球芯片行业排名靠前的外资企业，在中国拥有200mm和300mm两条生产线，每条生产线都有自己的MES（制造执行系统）系统。其中数据库MESDB是重中之重，采用Oracle RAC来实现高可靠性，跑在两台满配的HP rp7640上，后升级到rp8640，存储系统也采取了HP高端的XP12000。每个系统的两台主机通过自己的SAN连接到自己的XP12000上，两台XP12000通过CA（continuous access，类似EMC的SRDF）软件同步对方的MESDB数据库，防范万一XP12000故障，数据不丢失。系统架构图如下：

由于是芯片企业，系统可靠性是第一位的，一旦停机损失惨重（每小时的损失高达100万美金，主要是停产的产品销售额和高昂机器设备的折旧），所以在IT系统上是非常舍得投入的。虽然采用了RAC，但负载全部集中在其中一台机器上，采购两台一样配置的机器加RAC就是为了在down机时，能零时间切换到另外一台机器上。

从上图可以看出，200mm和300mm的MES系统互相隔离，两个SAN也没有连接起来。客户的应用部门认为，万一300mm的存储XP12000坏掉，虽然在200mm的XP12000系统上仍然有数据，但是应用并不能自动切换来访问，所以提出了系统容灾的项目。由于系统大部分是HP的，当然HP被邀请提交解决方案。另外客户在其他的系统上还使用了EMC的Symmetrix，有竞争才能获得更好的价格，同时EMC也对这样一个大客户虎视眈眈，所以EMC也参与了方案提交。最后总共提交了三个方案：

方案 1：HP Campuscluster + RAC

方案 2：HP Metrocluster+CA

方案 3：Oracle data guard

阅读(431) | 评论(0) | 转发(0) |

上一篇：三种常见光纤接口介绍

下一篇：分析HP Metrocluster+CA

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6