Chinaunix首页 | 论坛 | 博客
  • 博客访问: 11488774
  • 博文数量: 8065
  • 博客积分: 10002
  • 博客等级: 中将
  • 技术积分: 96708
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-16 17:06
文章分类

全部博文(8065)

文章存档

2008年(8065)

分类: 服务器与存储

2008-07-21 17:04:51

虽然复杂的RAID 系统有着特定的结构保护你的数据,但由于误操作和硬件故障引起的数据丢失还是频繁地发生。大多数RAID用户看重的就是 RAID的容错功能, 然而很多误导宣传也使用户误以为RAID是不容易出故障或出现故障时RAID本身有处理容错的应变机制,所以没有认真地作备份, 因而忽视了RAID潜在危险,所以每当RAID故障时都是一场大的灾难。

    RAID 系统在出现故障是如果处理得当,在大多数情况下数据都是可以恢复的。在这里向大家介绍一种RAID 的数据恢复方法。为此我先介绍两个非常好用的工具软件,它们是 Runtime Software公司的Getdataback 和RaidReconstructor, 其中 Getdataback 用于恢复数据,Raid Reconstructor 用于恢复 Raid 5的磁盘阵列。

下面我就向大家介绍一种恢复 Raid 5 磁盘阵列的数据的方法。我们以一个只有3 块硬盘的 Raid 5阵列为例。

下面是Raid Reconstructor 的用户界面:

    Runtime 的 RAID Reconstructor 帮助我们从损坏的RAID 5 阵列中恢复数据. 即使我们不知道 RAID 参数,比如磁盘次序, 块大小和旋转方向, RAID Reconstructor 能自动分析和确定正确的值,然后使我们能够重新构造一个RAID 镜像文件或物理驱动器的拷贝。一旦我们建立了一个镜像文件, 就可以使用 Runtime 的GetDataBack或其它数据恢复软件进行处理. 如果我们把这个镜像建立在一个物理驱动器上, 我们既可以用数据恢复软件处理它,也有可能直接从它上面启动系统。

因为 RAID 5 冗余性, 如果原阵列里的磁盘数为N ,RAID Reconstructor 通过N-1 个磁盘也能重新计算出原来的数据。

使用Raid Reconstructor的三个简单的步骤:规定 RAID 阵列的组合

输入原始 RAID 5 阵列的硬盘数.然后我们输入RAID的每个物理硬盘或硬盘镜像文件。如果你使用物理硬盘名,这些硬盘必须是可以访问的。我们可以使用镜像文件代替物理硬盘(这个镜像文件可以用Runtime的 GetDataBack 或DiskExplorer建立。

注意:如果在物理驱动器上有坏扇区, 建立磁盘的镜像文件将是我们的首选方法。

如果我们不知道RAID 参数, 保留这个值, 不改变块长度和奇偶校验的旋转方向。

例如 RAID 5阵列由3块硬盘组成, 挂在我们的计算机上作为独立的物理硬盘HD130:, HD131:, HD132:

又例如: RAID 5阵列由3个镜像文件组成, 它预先建立在我们的逻辑驱动器 E 上: DRIVE1.IMG, DRIVE2.IMG, DRIVE3.IMG.

我们也可以混合选择物理硬盘和镜像文件.

单击 "Open drives" 选择的每个硬盘或镜像的容量会显示在右边,同时RAID 的总容量将显示在下面:

注意: 我们输入的硬盘个数可以小于阵列的长度. 在这个例子中 #drives 仍然是 3 ,但可以保留一个空的驱动器分析 RAID 结构,确定正确的磁盘次序、块大小和旋转方向.

如果我们知道正确的参数, 则把它们直接填写在输入框里就可以了, 并可以跳过分析. 否则单击 "Analyze".

这时屏幕上会弹出一个窗口,让我们选择一些测试组合。我们可以参考RAID 控制器的设置手动改变某些选项。大多数值已经用缺省方式选择了。如果需要,我们可以输入多个定制的块长度. 但块的长度必须 2 的幂数如: (16, 32, 64,...).

"Number of sectors to probe" 确定动态测试多少扇区,缺省是100000, 但如果需要的话你可以根据块的大小增

加这个值,例如, 500000 或 1000000.

单击 "Next". 根据硬盘个数、检查条件组合数和测试的扇区数,测试分析时间可能从几秒钟到数小时。

当分析完成后将生成下面的列表:

最有可能的参数组合列在该表的前端,通常我们都选择推荐的第一项.

在上述例子里我们看见每种可能的排列都有3 行显示数据, 它们代表的意思如下:

硬盘次序 (Drive order)

可能的情况是 (1-2-3), (1-3-2), (2-1-3), (2-3-1), (3-1-2) 或 (3-2-1), 共有 6 种可能的组合.块长度 (Block size)选择了 4 种可能的组合16, 32, 64 或 128.奇偶校验块的旋转方向(Parity rotations to probe):

有向前(forward)、向后(backward) 2种情况。所以在列表上一共列出了48 (6*4*2) 种可能的组合。

如果结果数据有意义, 每个组合都将被检测. 每个检测都有一个平均值,这个值叫 "entropy"(平均值). 着个

值越小表示越接近正确的 RAID 参数值。

"OS:" 的值在 0—5 之间, 1到4 代表的意义如下:

OS:1) 扇区 63 有一个 boot 记录标记 (xAA55).

OS:2) 扇区 63 是一个合法的 NTFS、 FAT32 或 FAT16 boot 扇区.

OS:3) NTFS: 第一个 MFT 项被成功装入, FAT: 找到FAT1.

OS:4) NTFS: 前16 个MFT项被成功装入, FAT: 发现FAT2 , 并且 FAT2 的第一个扇区和 FAT1 的第一个扇区相同.

选择上面描述的项(最有可能的是第一项)并单击 完成“Finish”. 这样就把我们选择的参数拷贝到主屏幕。拷贝 RAID现在我们就准备把RAID 拷贝到另一个镜像文件或另一个驱动器上,当然目标设备必须有足够的空间来容纳这个RAID。

在目的 "Target" 框中输入要拷贝得文件名和路径. 它可以是物理驱动器名(如"HD132:"), 也可以是镜像文件名(如E:\raid.img").

在缺省的情况下普通镜像文件的扩展名是".img",压缩镜像文件的扩展名是".imc". 如果我们在 "Multi file" 选择框中打勾, 则镜像文件就会被分割成若干个文件, 每个650 MB. 这对某些系统(例如 Windows 98/95)来说是必要的, 因为它们不支持超大文件。

其它选项:

奇偶校验检查(Verify by parity):

拷贝时用奇偶校验块对RAID的每个带区块进行完整性检查。

增加额外扇区(Append extra sectors):

当物理驱动器的容量大于镜像文件的长度时, 有可能要选择此项, 这时会把物理驱动器的所有柱面填充满。这是要模拟整个驱动器,便于以后某些数据恢复软件能够对它进行处理(如GetDataBack).

单击 拷贝 "Copy". 现在开始重构RAID:

下一步是什么?

如果我们运气好的话,把这个RAID镜像拷贝到另一个硬盘或阵列上,就能直接通过操作系统存取这个设备上的文件,这样数据恢复就成功了。否则, 你还要用 Runtime 的GetDataBack 或其它数据恢复工具试试,能否成功就要取决于数据的损坏程度了。

另一篇文章
raid恢复--EDI阵列 42块盘3组Raid5恢复全攻略
EDI6600FF 系列是一款高性能的光纤通道存储产品 ,EDI6600FF 的一个磁盘子系统可支持 14 个磁盘 , 当需要更多存储容量时,可通过连接最多 8 个子系统,达到 112 个硬盘的总容量。
本案例是由一个主柜和三个扩展柜组成的 4 组 raid5
故障描述:
由于 Raid 卡硬件设备故障,导致 4 组 Raid5 中的 3 组在系统上识别不了。阵列中的数据非常重要,即便更换 Raid 卡,重新配置 raid 信息,也不能保证数据安全。经再三考虑,客户决定先寻找一种相对安全的方法,把数据都备份出来,然后才决定更换硬件设备。
解决方案:
面对眼前的 42 块从阵列中拔下来的光纤接口的大小为 146GB 的硬盘,技术工程师如果没有丰富的经验和深厚的数据恢复知识,一是不能平静自己,二是不能说服客户。护航时代的小伙子们从容接下了这个项目。
第一步、确定磁盘分组 硬盘是从 1-42 编号,第一组、第二组、第三组故障 Raid5 都是由 14 块盘组成。每组 raid 中的 14 块盘并不是一个节点中的 14 块盘,而是几个节点中的盘都有,幸好硬件工程师在配置 raid 的时候做了详细的记录,省了从 42 块盘中分析哪 14 块盘是一组 raid5 的时间, raid5 磁盘分组确认顺利完成。
第二步、分析底层数据走向 这一步是 raid 数据恢复最关键的一步,其实只要分析出一组 raid5 的数据组合规律,其它两组也就顺理成章的出来。有了经验以后, raid5 是最常见也是比较容易分析的,它不像 HP RAID ADG 、 Raid1+e 、 Raid1 扩展等那样难。技术工程师很快就分析出数据组合规律。
第三步、重组数据 如果说分析数据走向是关键一步的话,那么重组数据就是最核心的技术了。护航时代拥有自主知识产权的“护航舰” Raid 数据重组软件,可以重组任何一款 Raid 数据。有些数据恢复公司每当遇到一种算法较为复杂 raid ,借助市面上的数据恢复软件没法做到的,就认为是不可修复的。其根本就是不专业的技术,用二流的免费的或者国外破解版的数据恢复软件去恢复高端 raid 故障,只能是碰碰运气,根本没有理论和技术支撑。“护航舰” raid 恢复技术,从理论上可以证明哪些故障是可救的,哪些是不可救的。
实际操作中遇到的问题:
天有不测风云,人有祸福旦夕。在数据恢复过程中,数据还没展现在你的眼前之前,你千万不能说 OK ,因为在这里头的不确定因素较多。原本以为第一组故障 raid 重组很顺利,没想到这 14 块盘中有一块盘识别不正常,然后我们缺这个块盘进行数据重组,没想到组合到 70GB 的时候发现有一块盘有大量物理坏道,我们只能终止程序。当发现 raid5 中有两块及两块以上的盘出现物理故障,数据恢复到这个阶段人的心情是最郁闷和难受的。但是凭经验,我们决定对有坏道的硬盘单独做个镜像,然后用镜像文件重组。实在不行,就只能抢修不能识别的那块盘了。最后终于克服了所有困难,成功恢复出所有的数据。
小结:
在高端存储设备出现故障时,首先要想到的是数据的重要性,其实这就是一种思想认识和备份意识。如果数据非常重要,我们建议不要在故障设备上作任何夸张的操作(指的是 Rebuild 、初始化、同步数据、重配 raid 等),这些操作都是比较致命的,是不可逆的。要寻求专业的数据恢复公司,给您提供合理的恢复方案,您才能放心的把您的硬盘送上手术台。那些非专业公司,如果要求您提供阵列卡或者服务器做恢复的话,您应该考虑其技术的可靠性。
阅读(353) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~