Chinaunix首页 | 论坛 | 博客
  • 博客访问: 354239
  • 博文数量: 608
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 6115
  • 用 户 组: 普通用户
  • 注册时间: 2016-08-02 14:16
文章分类

全部博文(608)

文章存档

2024年(172)

2023年(218)

2022年(181)

2020年(12)

2019年(24)

我的朋友

分类: 服务器与存储

2022-08-01 11:33:22

服务器Raid磁盘离线故障:
服务器中有一组或多组Mdisk,其中一组Mdisk中有一块硬盘故障离线,热备盘启动并且开始同步数据,如果同组Mdisk中的另一块硬盘也因为故障离线就会导致热备盘同步失败,该组Mdisk失效,从而导致整个卷无法使用。


服务器Raid数据恢复过程:
1、对故障阵列中的每一块磁盘进行镜像备份,后期所有的数据恢复工作将在镜像文件上进行,不影响原始磁盘数据。
2、分析并重组Mdisk,首先根据用户提供的配置信息,把硬盘按照Mdisk组进行分类。分析每一组Mdisk中的所有硬盘,获取raid相关信息。使用专业的数据恢复软件虚拟重组Mdisk。
3、分析所有Mdisk获取到pool的相关信息。使用专业的数据恢复软件虚拟重组出pool。
4、掉盘分析。由于raid5最多只能允许一块成员盘离线,raid5崩溃至少有两块盘发生故障离线。北亚数据恢复工程师对各成员盘中的底层数据进行分析,发现有两块硬盘前部的数据完全一样,初步判断这两块盘中一块硬盘为热备盘,另一块硬盘为故障盘。
据此可以判断故障情况:raid5中有一块成员盘发生故障离线,热备盘上线开始同步数据,与此同时另一块成员盘也发生故障离线,raid失效。Raid恢复正常时,由于先发生故障的硬盘上的数据已经不是最新的,所以恢复正常后的raid中的数据出现部分错误。
5、对硬盘的raid结构与成员盘的掉盘情况分析完成后,使用专业数据恢复软件完成对Mdisk和pool的组建,并生成其中的数据。


小贴士:服务器磁盘阵列故障后应该怎么做?
1、不要盲目强行上线。
Offline指示灯亮起,这表示要求更换一个相同型号的无故障硬盘,并且重新校验算法。RAID磁盘阵列中很可能有不止一个出现了不稳定现象,服务器的Offline提示经常会误报或是遗漏其他也存在隐患的硬盘。强制上线过程中硬盘进行大量的读写操作,一旦其它硬盘掉线则数据恢复难度加大。所以在强制上线前要检测每一个硬盘的稳定性,这样才更加保险。


2、保护好第一现场
对于厂商而言,硬件设备修复才是售后服务的主要目标,因此往往为修复硬件设备故障而牺牲掉数据。北亚数据恢复中心的工程师介绍:用户寻求厂商的售后服务工程师服务而导致数据被彻底破坏的情况几乎每个星期都会发生。厂商的售后服务工程师都偏向于硬件修复,而RAID数据恢复则是以软件类操作为主。此外,即便是简单的检验性操作,也有可能为后期的数据恢复带来不便。当raid硬盘损坏数量超过阵列自身的容错能力时,必须将损坏硬盘的镜像完全提取才能完成最终的恢复。如果频繁对硬盘上电,很容易造成磁头疲劳损伤,甚至划伤盘片。正确的处理方法应当是立即咨询专业的数据恢复服务商。


3、选择专业正规的数据恢复中心
在选择数据恢复服务商时,公司规模、技术经验、工程师团队、业界内的口碑都是需要考量的重要指标。
阅读(289) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~