服务器数据恢复环境:
某单位一台DS5300存储,1个主机+4个扩展柜,组建了2组RAID5(一组27块硬盘,一组23块盘)。27块盘的那组RAID5阵列存放Oracle数据库文件,存储系统一共分了11个卷。
服务器故障:
27块盘的那组RAID5阵列中有2块磁盘故障离线,导致RAID阵列崩溃,存储不可用,存储设备已经过保。
服务器数据恢复过程:
1、将存储中崩溃的RAID5阵列中的27块磁盘编号后取出。由硬件工程师对这27块硬盘做硬件故障检测,经过检测在其中2块磁盘中发现坏道、SMART的错误冗余级别已经超过阈值。以只读方式将25块正常硬盘做全盘镜像,针对2块发现坏道的硬盘,使用工具处理后生成镜像文件。镜像完成后将所有盘按照编号还原到原存储中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、北亚企安数据恢复工程师收集&分析故障存储的日志信息,分析两块掉线硬盘的掉线时间,找出数据较新的那块硬盘,用数据较新的硬盘来恢复数据。
3、先在模拟器上进行测试,然后通过IBM DS存储管理软件进行强制上线,在强制上线之前把存储的所有硬盘都进行备份,之后进行强制上线。
通过IBM DS存储管理软件进行强制上线,强制上线之后raid处于降级状态,北亚企安数据恢复工程师设置好热备盘后让热备盘上线同步数据,同步完成后上层的卷可以直接使用了,所有数据都可以看见了,上层应用也能正常使用。
备选方案:分析硬盘底层数据→重组RAID5阵列→从底层提取数据→重新加载oracle数据库→调试上层应用。
4、将卷里的文件都拷贝出来移交给用户方。经过用户方的检测,确认恢复数据完整可用。本次数据恢复工作完成。
阅读(100) | 评论(0) | 转发(0) |