2008年(8065)
分类: 服务器与存储
2008-10-18 07:29:15
背景资料:
2008年8月12日,达思北京数据恢复公司总部来了一位特殊的客户,北京佳讯飞鸿电气有限责任公司的技术主管李先生。为什么说是特殊的客户呢?因为每个到达思做数据恢复的客户都比较急切,并且非常关注恢复数据的可能性有多大,尤其是数据恢复的客户更为明显。可是,李先生却仿佛对数据恢复的结果并不关心,也许并不是不想关心,而是认为关心也没用了吧。
李先生回忆起服务器故障:7月中旬,这台服务器突然无法访问,经检查,初步判断是RAID控制器出现故障,更换RAID卡后重建;同时更换了原装的RAID卡连接线,磁盘阵列依然无法访问。三天以后,在多次努力无果的情况下,公司决定找数据恢复公司恢复数据。
经人介绍,李先生把RAID 5ee的5块硬盘送到了位于中关村E世界的北京某数据恢复中心。5天后,李先生被告之数据无法恢复。IT信息部的同事一下子意识到了问题的严重性,取回硬盘后召开紧急会议。经历了一次失败,大家一致认为,必须寻找一家权威的数据恢复公司进行二次数据恢复。最终,大家一直同意送到某国字号的数据恢复中心进行恢复。由于是二次恢复,数据恢复的价格也飙升到第一次的四倍。不过,大家还是满怀希望的等待数据恢复成功的消息。
到了第12天,IT信息部的经理张先生休年假结束,回公司上班了。张经理得知了服务器宕机后以及恢复数据的整个过程,赶紧与某国字号数据恢复中心进行沟通,得到的答复是:“把服务器送过来吧,我们要搭建原始环境后强制上线,数据恢复有50%的可能性。”张经理立即决定把硬盘拿回来。实际上,这是非常冒险的做法,强制上线失败,数据恢复的可能性就等于零了。RAID 5EE的五块硬盘第二次被拿回了公司,张经理组织信息部门及主管领导一起开会,研究该怎么办?
首先,会议确定了两手准备的方案,一方面再次寻找数据恢复公司进行恢复数据,一方面配合各部门补录数据。
其次,寻找数据恢复公司的标准要有解决方案,又可以信赖的真实的成功案例。
第三,恢复以前的备份数据。
领导的批准后,张先生把5块硬盘第三次送到了数据恢复公司,这次选择的是亚洲技术领先的达思数据恢复公司。与达思工程师沟通后,达思承诺3天内出最终的检测结果,7天出最终的数据恢复结果。
达思数据恢复公司工程师团队为RAID5EE全面体检,组建服务器专家团队攻关
经过北京达思数据修复中心的工程师团队认真检测,还原出服务器发生故障后的操作过程。服务器被搬运时,RAID控制卡发生故障,更换后对硬盘进行Rebuild。此时的RAID配置信息已经破坏,试图通过硬盘进行重建,没有成功。万幸的是,Rebuild进行的并不顺利,否则可能会清空数据。在数据恢复公司进行恢复数据操作时,硬盘被进行强制上线进行了8%后停止;此外,在第二家数据恢复公司进行操作时,被当作RAID5进行数据重组进行了一段时间后停止。
本RAID5EE数据恢复的难点如下:
1、 校验位隐藏比较深;
2、 被当作RAID5重组过,表现为RAID5的假象;
3、 RAID 5EE的每块硬盘前8%的数据错乱,需要手工修复,难度大而且工作量大;
4、 目录结构严重覆盖,完全修复几乎不可能。
5、 数据量超过400GB,绝大多数是工作文档类的小文件,文件数特别多。
6、 其他未知的难点。
达思硬盘数据修复中心组织研发中心的骨干召开了会诊会议,综合分析了上述难点,经过一整天的分析会议,得出了可行的解决方案。
深入分析校验码,反复论证校验信息的正确性;
为解决RAID 5EE数据恢复工具的不足,现场编写程序组建错乱数据,前提是校验位准确定位;
手工修复目录表,尽可能完善恢复出的数据目录完整;
优化程序,提高重组数据的效率。
经过7天的努力,数据重组成功。由于目录结构严重破坏,大约有25%的数据文件目录无法正确重组,但是数据都可以正常打开。
第一时间通知了佳讯飞鸿的张先生,通过2天几个重点部门的数据验证,达思数据恢复的工程师得到了数据验证成功的消息。达思创造了奇迹,挽救了价值超过千万元的数据,成功恢复了多家数据恢复公司恢复失败的RAID 5EE的疑难服务器。
通过这次合作,佳讯飞鸿与达思数据恢复签订了长期合作协议,达思作为唯一指定数据恢复服务供应商,长期为佳讯飞鸿提供给类介质的数据修复服务。
小知识:什么是RAID 5EE?
RAID 5EE是一个比较实用的技术。RAID 5EE提供了一个完善的替代“RAID5+HotSpare”盘的解决办法。原来的一块单独HotSpare热备份盘也进行Stripe条带化,并且平均分配到了5块磁盘中。这样,在RAID 5EE读写的时候,5块磁盘同时参与I/O,相比于4块磁盘+HotSpare盘的情况,多了一个磁盘的读写带宽,提高了性能。特别是在整体磁盘数量比较少,如4/5/6等的情况下,性能的提高尤为明显。
RAID 5EE优秀的安全性表现被企业广泛应用
RAID 5EE相比于RAID5性能提高,那对于可靠性和容量利用率有什么影响呢?对于RAID 5EE来讲,一块硬盘损坏,就会自动重构成一个RAID5,另外一个硬盘再损坏,就会变成Degraded状态的RAID5,这和RAID5+HotSpare的容错能力是一样的,也就是可靠性一样;对于RAID 5EE来讲,损失的容量为2块物理磁盘,而对于RAID5+HotSpare来讲,损失的容量也为2块物理磁盘,所以容量利用率也一致。
值得注意的一点,RAID 5EE中包括的HotSpare盘是分布在每个磁盘中的,只能供RAID 5EE本身来使用,不能做另外RAID5的热备。也就是说,如果客户有两个或者更多个RAID5,一个HotSpare盘需要为所有RAID5服务的话,客户不要使用RAID 5EE,因为RAID 5EE只适用于替代一个RAID5+HotSpare盘的情况。