2008年(8065)
分类: 服务器与存储
2008-06-08 02:15:32
EDI6600FF 系列是一款高性能的光纤通道存储产品 ,EDI6600FF 的一个磁盘子系统可支持 14 个磁盘 , 当需要更多存储容量时,可通过连接最多 8 个子系统,达到 112 个硬盘的总容量。
本案例是由一个主柜和三个扩展柜组成的 4 组 raid5
故障描述:
由于 Raid 卡硬件设备故障,导致 4 组 Raid5 中的 3 组在系统上识别不了。阵列中的数据非常重要,即便更换 Raid 卡,重新配置 raid 信息,也不能保证数据安全。经再三考虑,客户决定先寻找一种相对安全的方法,把数据都备份出来,然后才决定更换硬件设备。
解决方案:
面对眼前的 42 块从阵列中拔下来的光纤接口的大小为 146GB 的硬盘,技术工程师如果没有丰富的经验和深厚的数据恢复知识,一是不能平静自己,二是不能说服客户。护航时代的小伙子们从容接下了这个项目。
第一步、确定磁盘分组 硬盘是从 1-42 编号,第一组、第二组、第三组故障 Raid5 都是由 14 块盘组成。每组 raid 中的 14 块盘并不是一个节点中的 14 块盘,而是几个节点中的盘都有,幸好硬件工程师在配置 raid 的时候做了详细的记录,省了从 42 块盘中分析哪 14 块盘是一组 raid5 的时间, raid5 磁盘分组确认顺利完成。
第二步、分析底层数据走向 这一步是 raid 数据恢复最关键的一步,其实只要分析出一组 raid5 的数据组合规律,其它两组也就顺理成章的出来。有了经验以后, raid5 是最常见也是比较容易分析的,它不像 HP RAID ADG 、 Raid1+e 、 Raid1 扩展等那样难。技术工程师很快就分析出数据组合规律。
第三步、重组数据 如果说分析数据走向是关键一步的话,那么重组数据就是最核心的技术了。护航时代拥有自主知识产权的“护航舰” Raid 数据重组软件,可以重组任何一款 Raid 数据。有些数据恢复公司每当遇到一种算法较为复杂 raid ,借助市面上的数据恢复软件没法做到的,就认为是不可修复的。其根本就是不专业的技术,用二流的免费的或者国外破解版的数据恢复软件去恢复高端 raid 故障,只能是碰碰运气,根本没有理论和技术支撑。“护航舰” raid 恢复技术,从理论上可以证明哪些故障是可救的,哪些是不可救的。
实际操作中遇到的问题:
天有不测风云,人有祸福旦夕。在数据恢复过程中,数据还没展现在你的眼前之前,你千万不能说 OK ,因为在这里头的不确定因素较多。原本以为第一组故障 raid 重组很顺利,没想到这 14 块盘中有一块盘识别不正常,然后我们缺这个块盘进行数据重组,没想到组合到 70GB 的时候发现有一块盘有大量物理坏道,我们只能终止程序。当发现 raid5 中有两块及两块以上的盘出现物理故障,数据恢复到这个阶段人的心情是最郁闷和难受的。但是凭经验,我们决定对有坏道的硬盘单独做个镜像,然后用镜像文件重组。实在不行,就只能抢修不能识别的那块盘了。最后终于克服了所有困难,成功恢复出所有的数据。
小结:
在高端存储设备出现故障时,首先要想到的是数据的重要性,其实这就是一种思想认识和备份意识。如果数据非常重要,我们建议不要在故障设备上作任何夸张的操作(指的是 Rebuild 、初始化、同步数据、重配 raid 等),这些操作都是比较致命的,是不可逆的。要寻求专业的数据恢复公司,给您提供合理的恢复方案,您才能放心的把您的硬盘送上手术台。那些非专业公司,如果要求您提供阵列卡或者服务器做恢复的话,您应该考虑其技术的可靠性。