Chinaunix首页 | 论坛 | 博客
  • 博客访问: 412281
  • 博文数量: 157
  • 博客积分: 5010
  • 博客等级: 大校
  • 技术积分: 1975
  • 用 户 组: 普通用户
  • 注册时间: 2009-02-17 15:22
文章分类
文章存档

2013年(19)

2011年(1)

2009年(137)

我的朋友

分类: 服务器与存储

2009-04-07 13:47:48

写在前面的话
从电力管理单位的机构分布来看,省级电力营销管理信息系统一般担负着全省的电力营销管理,存储和传输的信息量十分巨大,基本每一个供电局就有十多万个用户信息。一旦主机出现故障或者由于意外
事故导致系统毁损,业务数据很难恢复,损失之巨难以弥补。因此,电力行业用户对灾难备份方案的需求和其他行业一样极为迫切。尽管现在专门针对电力行业的灾备方案并不多,但是从灾备本身来看,行业间的差别并不太大,所以其他行业的解决方案或者通用性的解决方案对于电力行业用户都具有非常强的借鉴意义。
因此我们组织了这次灾备方案的评析活动,在活动中我们征集了大量的灾备方案白皮书,对其内容进行了深入研究,希望能通过对方案白皮书的分析找到当前灾备方案的共性和存在的问题,为用户也为厂商提供一些有价值的研究结果,以便用户能够更好地选型。需要提示的是,此次“灾备方案评析”的结论是在《计算机世界》方案评析实验室工程师以及计世资讯分析师们认真评估的基础上,结合《计算机世界》报社“首届中国灾难备份与应急响应”大会上用户的大量反馈得出的。
在这次灾备方案评析活动中,无论是通过大量调研工作建立评价体系的计世资讯的分析师们,还是直接参与到具体评分过程的方案评析实验室的工程师们,都有非常明确而且一致的观点: 我们所做的一切工作,最初动因都是来自于大量用户在方案选型工作中的苦恼。这些苦恼在企业用户当中并不少见,其中的原因是多样的、复杂的,我们无力(也无意)冒“蚍蜉撼大树”之大不韪,企图“帮助”用户解决所有问题。但是,经过和许多CIO交流,我们发现,他们因为缺乏一套全面的、有效的、权威的评价体系或者说依据,而无法对摆在面前的众多方案做出评价,对其优劣也无从判断。同时,在很多时候他们也很难将市面上所有的同类方案集中起来进行横向对比。而这些恰恰是《计算机世界》作为最权威的IT媒体所具有的优势,借助这一优势,我们可以将用户、厂商、专家等多方资源进行整合,实现从建立理论体系到方案评价的整个过程。
评价体系要从用户中来
既然是横向评析,那么最基本的一条原则就是要公平、客观。基于这样的基本原则,我们首先需要建立一套客观的评价体系。
这套体系要足够的科学、详细、全面,保证后面打出的每一分都有据可查、有理可依。同时,我们也坚信这样的体系不应该完全来自于厂商,而应该更多地来自于用户和专家,用户和专家最关心的问题就是体系中应该重点考察的内容,也正是基于这样的考虑,计世资讯分析师们的大量调研对象中,用户和专家的比例超过了80%,其中用户占到了50%,他们分别来自政府、金融和电信三个行业,分析师们对于他们提出的问题和观点进行细分和挖掘,并且分成多级考核指标,这些在评分细则中进行了详细说明。
计世资讯分析师们在专家访谈、用户访谈、厂商访谈和桌面研究的基础上,形成了一套初步的灾备方案评析指标体系。随后又与《计算机世界》报社的资深编辑以及方案评析实验室的工程师们逐项进行了分析和研讨,最终经过两个月的努力终于完成了这套灾备方案评析指标体系的1.0版(之所以称为1.0版,是因为这套体系在相对稳定的基础上应该不断征求用户和专家的意见,结合操作过程当中的实际情况进行调整,不断完善)。
这套体系由三级指标构成,一级指标包括灾备方案白皮书的内容和形式两方面:形式指厂商提交的灾备方案白皮书的撰写格式等外在的呈现形式;内容指方案白皮书都描述了灾备的哪些方面。形式指标进一步细分为逻辑结构、美观性和语言文字三个方面: 内容指标进一步细分为需求分析、设计思路、方案实现、方案特点等八个方面。第三级指标又对第二级指标中的重点内容进行了进一步的细分。整个评价体系结构重点突出、逻辑分明。
另外,在这套体系中,每一项指标都根据重要程度被赋予了相应的权重。这些权重值的确定是在专家回访的过程中进行的一项极为重要的工作,权重体现了用户和专家对其关注的程度,以及决定用户最终选型的重要程度。从各级指标权重的分布情况来看,在很大程度上反映出了用户的需求。就一级指标而言,形式占23.5%,内容占76.5%,说明对于灾备方案白皮书而言,形式并非如我们想像当中的那么无关紧要,它可以在很大程度上帮助用户理解方案内容。而在内容下的二级指标中,用户对方案特点的描述最重视,占20%的比重; 其次是方案实现,占18.5%。另外,需求分析和成功案例也对用户的评价产生重要影响。在最受重视的方案特点中,RTO(对恢复时间指标的描述)更受关注,其次是系统效率和运维管理,最后是RPO(对恢复点目标的描述)。
87.5%的方案得分低于总分一半
在上述评析体系的基础上,由《计算机世界》方案评析实验室的工程师担任评估人,对重点的8个综合性厂商的灾备方案进行了背对背的评分,然后集中点评,取其平均值,形成灾备解决方案评估报告。(说明:由于软件方案和硬件方案在很多指标上并不具备可比性,所以由VERITAS和甲骨文公司提供的灾备方案并没有被作为评析对象,仅仅是作为参考方案。)
经过对最终评析结果的研究,我们发现,很多厂商提供给用户的解决方案在较大程度上存在“闭门造车”的现象,也就是说厂商对用户需求的了解并没有像其宣传的那样深入。从得分情况来看,设计思路和物理实现等指标的得分普遍高于方案特点、方案效果、成功案例等指标,这反映出厂商把精力比较多地都关注在了技术问题上,而少有对应用问题的关注,这也是这些方案有些脱离用户的一种表现。从另一个方面来看,集成商普遍比产品提供商更了解用户,这一点在得分上也有所体现。
对于用户非常关心的方案特点这一指标,得分普遍不高,绝大多数方案在灾备最关键的两项指标—RTO(最短恢复时间)、RPO(数据恢复率)方面都没有任何数据提供,所以基本上得分都为0分。而且,很多厂商把灾备方案的基本功能作为其方案的“特点”呈现给用户,所以这些“特点”的同质化现象比较严重,最终并不能很好地向用户呈现其“最美”的一面。例如,很多方案都强调自己可以保证主、备节点的数据一致。试想,如果连数据一致都无法保证的话,这样的方案还能用来容灾吗?从总体情况来看,各方案的综合得分普遍较低,绝大多数都低于总分(总分为10分)的一半,平均得分为3.39分。
需求分析总体较好
需求分析反映了厂商对市场和用户的了解程度,好的需求分析不仅能够准确把握行业特点、需求动态,而且对用户来讲还会有一定的启发意义,使用户可以了解到更加深层次的,甚至是未来的需求。
需求分析越有针对性越能体现出厂商的功力,因为既然是“方案”,就要和通用性的产品区别开来,它是针对某一类特定用户的特定需求而制定的一系列方法和产品的组合。同时,如果需求分析不到位,用户选型将受到极大影响,最起码用户无法直接了解到这些方案是给谁设计的。例如某方案对用户需求是这样描述的:“随着IT应用重要性的逐渐增加,现在,避免灾难发生后所导致的数据灾难问题更加突出。”如此大白话式的“分析”又怎能提高方案的说服力呢?与之相反,在EMC公司的方案中,需求分析却具有一定的启发性。
它是这样描述的:“无论是非计划的还是计划的停机,结果是相同的——最终用户难以得到数据和应用服务,并且业务不能从那些信息中产生收入。当今,越来越多的业务寻求实施业务连续性方案,取得最多的收入和利益。”
从得分情况来看,需求分析指标得分总体不错,平均得分为6.67分,其中EMC、HDS和天科思诺等公司提供的方案较为突出。EMC和HDS的方案在需求分析时是针对一个行业和某类业务需求进行较为深入的分析,天科思诺的分析虽然比较泛,但很详尽。
设计思路参差不齐
面对用户的需求,厂商是怎么考虑满足这些需求的,这主要在其设计思路中得以体现,而设计思路是否合理清晰则取决于厂商对用户面临问题理解的深度和它的专业水准,能够在很大程度上影响方案的说服力和用户的选型方向。
例如某方案是这样描述其设计思路的:“备份(注:这里应该用“灾备”一词。)是一种数据安全策略,是将原始数据完全一样地复制,严格来说应复制两份,保存在异地。在原始数据丢失或遭到破坏的情况下,利用备份数据把原始数据恢复出来,使系统能够正常工作。”这样的描述其实谈不上是一种设计思路,这是任何一个灾备方案都遵循的基本原理,没有显示这一方案在设计上的任何特点,信息量极其有限,对于用户了解这一方案几乎没有任何帮助。而另外一种描述就显得清晰多了:“容灾系统的建立需要包括两个部分:数据容灾和应用容灾。数据容灾就是指建立一个异地的数据系统,该系统是本地关键应用数据的一个实时复制。应用容灾是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以是互为备份),在灾难情况下,远程系统迅速接管业务运行。可以说,数据容灾是抗御灾难的保障,而应用容灾则是容灾系统建设的目标。”
其实,同一类的不同方案的设计思路在通常情况下都是比较相似的,可以说是大同小异,因此,如果厂商不能在这方面做更加深入的阐述,用户就很难发现其方案特点,同时也会影响方案的可信度和说服力。
从得分情况来看,该指标的平均得分为6.43分,分值比较高。但是从不同方案之间的对比来看,分值落差比较大,最高分和最低分相差4.6分。其中,得分最高的是天科思诺公司提供的方案,该方案的设计思路是在详细的技术分析的基础上得出的结果,具有较为科学的依据。
产品与方案脱离
物理实现也是一项重要指标,这在任何一个方案当中都不可避免地要涉及到,这也是和最终应用最直接相关的部分。
通过对大量方案的研究,我们发现,尽管所有方案无一例外都把这一部分作为重点进行了介绍,但是有许多方案的介绍还是没有体现出方案与产品之间的联系。方案不是由一个一个孤立的软件和硬件产品堆在一起而成的,它们之间有一定的逻辑联系,这种联系体现的是从设计思路到逻辑结构再到物理产品之间的映射关系。同样的软、硬件产品通过不同的配置,不同的组合也许会得到应用效果完全不同的解决方案来。所以,部分厂商在方案白皮书中以产品功能说明书的形式一一列举每个产品功能的形式并不可取。事实上,产品之间如何搭配、为什么这样搭配、在不同的情况下要做哪些调整,这才是用户切切实实需要了解的,也是整个方案设计的精髓所在。
通过这个指标的得分可以看出,EMC和天科思诺公司提供的方案得分较高,EMC将其产品的实施方法谈得很详尽,天科思诺则是以图文对照的形式进行描述,较为清晰。而其他的一些方案虽然也详细地描述了操作方法和原理,但对于系统如何部署涉及较少。例如某方案是这样描述的:“采用如上结构的灾备系统中,每个地点的每台服务器上安装的软件相同,只是不同情况下配置方法不同。为方便论述,模拟结点A和B,两地各有一套建立在双节点集群上的业务系统,以B地点的系统作为A地点的备份。”这其实是以原理说明代替了物理实现,通过这段描述用户根本无从得知方案由何种产品组成系统,以及相互间的关系是怎样的。
编后语
正如文章最初所言,解决用户在方案选型过程中的苦恼是一件非常复杂的事情,不太可能通过对方案白皮书的评析来帮助用户完全解决。而且,事实上方案本身的优与劣并不取决于方案白皮书的好与坏,而是取决于方案在应用当中是否能够真正快速、灵活地满足用户的需求。而且同样的一个方案,同样的一系列软、硬件产品的组合对于不同的用户可能会有完全不相同的两种应用效果。所以,从理论上来讲,只有实践才是检验方案优劣的惟一标准。
但是,在实际选型中,用户几乎不可能通过在真实环境中适用来判断方案优劣,这在时间成本、人力、物力成本上都是不允许的。退一步讲,即使一个方案经过小范围的试用表现不错,也不能保证它在更大范围、更高压力的情况下仍然能表现出色。所以,用户在选型的初期阶段面对的只有方案白皮书,如果白皮书中不能为用户提供或描述足够多的有价值的信息,那么选型将更加困难。这恐怕就是我们进行此次容灾方案评析活动的意义所在吧。
阅读(1433) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~