服务器数据恢复环境:
华为OceanStor某型号存储,十几块FC硬盘组建一组RAID5磁盘阵列,配备了一块热备盘;上层使用EXT3文件系统,配置了oracle数据库。
服务器故障:
该存储RAID5中的一块硬盘未知原因离线,热备盘上线开始同步数据,同步未完成时候又有一块磁盘未知原因离线,数据同步失败,raid5瘫痪,上层lun不可用。
服务器数据恢复过程:
1、将故障存储中所有磁盘编号后取出进行物理故障检测,检测后发现为先掉线的磁盘存在物理故障,其他磁盘包括后掉线的那块磁盘均无物理故障。
2、将所有磁盘以只读方式做全盘镜像,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次影响。
3、基于镜像文件分析raid5中的所有磁盘底层数据,找出热备盘。raid是条带化的,阵列中的数据是按照一定的规律进行存储的。数据恢复工程师分析raid中的数据库页在每一个物理磁盘中的分布情况,计算出raid5的磁盘顺序、数据走向、条带大小等RAID相关信息。
4、根据分析出来的RAID相关信息,使用北亚企安自主开发的RAID重构程序将原始RAID虚拟重构出来。但由于原始RAID5中掉线了2块盘且有1块盘的数据被同步破坏,分析每一块硬盘中的数据后发现有一块硬盘在同一个条带上的数据和其他硬盘明显不一致,初步判断此盘是被同步破坏的硬盘。通过北亚企安自主开发的RAID校验程序校验这个条带,{BANNED}最佳终确定被同步损坏的磁盘。
5、分析lun在raid5中的分配状态和lun分配的数据块,根据数据MAP导出LUN的数据。
6、由于使用了热备盘虚拟重构RAID,EXT3文件系统无法正常挂载。
7、提取oracle数据库文件,使用北亚企安自主开发的文件系统解析程序对其进行文件系统解析,然后导出oracle数据库文件。
8、将导出的数据库文件移交给数据库工程师进行校验和验证。使用Oracle数据库文件检测工具检测每个数据库文件的完整性。如果发现错误,使用北亚企安自主研发的Oracle数据库检测工具进行二次检测。检测后发现部分数据库文件和日志文件错误,system和sysaux表空间都存在坏块,控制文件全部损坏;eschoolspace表空间的几个文件存在的坏块更多;undotbs02丢失;数据库数据恢复工程师对这些文件进行修复。
9、修复完成后,由用户方配合,启动Oracle数据库。在本地虚拟机安装OA客户端,通过OA客户端对数据记录进行验证。用户方安排不同部门人员进行远程验证,经过反复验证,确认数据完整有效。本次数据恢复工作完成。
阅读(127) | 评论(0) | 转发(0) |