Chinaunix首页 | 论坛 | 博客
  • 博客访问: 337071
  • 博文数量: 586
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 5905
  • 用 户 组: 普通用户
  • 注册时间: 2016-08-02 14:16
文章分类

全部博文(586)

文章存档

2024年(151)

2023年(218)

2022年(181)

2020年(12)

2019年(24)

我的朋友

分类: 服务器与存储

2022-12-09 14:10:58

服务器数据故障:

某公司服务器8块硬盘组成raid5磁盘阵列,其中有2块硬盘故障指示灯报警,其他硬盘指示灯正常,上层应用不可用。


服务器数据恢复过程:

1、服务器数据恢复工程师拿到故障服务器所有硬盘后对出现物理故障的2块硬盘进行物理修复并镜像备份里面的数据,同时找到2块硬盘故障原因:磁头损坏和逻辑故障。对其他完好硬盘做完整镜像备份。


2、服务器数据恢复工程师基于镜像文件对硬盘数据进行底层分析,查询55AA标志。下图中特别标注“05”的位置,这个标志表示这是一个扩展分区,不是正常分区,因此排除这个分区。





3、继续向下查找,发现了一个满足“55AA”标志,又在“0x01C6”位置的数值所指向的下一个扇区是分区头部的分区,也就是下图中的位置:





这个盘就是服务器内的{BANNED}中国第一块硬盘。GPT分区所在扇区起始于172032扇区,因此初步确定LUN的起始扇区是172032扇区。


4、Raid5磁盘阵列中每个条带组中包含一个校验区,校验区的大小和一个正常条带的大小是相同的。经过分析,故障服务器磁盘阵列中的条带大小是1024扇区。


5、根据已经分析出来的1024扇区的条带大小、扇区起始位置、校验区走向确定故障服务器上所有硬盘在raid阵列中的盘序。


6、根据分析出来的raid信息(盘序等)重组raid5阵列。完成raid5重组后校验数据完整性,检查上层应用是否可用,确认无误后由用户验证数据。


7、数据验证没有问题后,在用户服务器上使用新硬盘替换损坏硬盘重建raid阵列,将恢复出来的数据迁移到用户服务器上,本次数据恢复成功。


服务器数据安全Tips:


1、服务器发生故障后,切忌对服务器进行操作;也不要随意取出硬盘,以免弄乱盘序。

2、如果需要取出硬盘,标记好硬盘的顺序之后再取出。

3、服务器阵列瘫痪后应该立即断电,不要做同步或强制上线操作,防止数据进一步破坏。
阅读(403) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~