Chinaunix首页 | 论坛 | 博客
  • 博客访问: 336987
  • 博文数量: 586
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 5895
  • 用 户 组: 普通用户
  • 注册时间: 2016-08-02 14:16
文章分类

全部博文(586)

文章存档

2024年(151)

2023年(218)

2022年(181)

2020年(12)

2019年(24)

我的朋友

分类: 服务器与存储

2023-01-12 14:22:03

服务器数据恢复环境:
昆腾系列存储,9个磁盘柜,每个磁盘柜配置24块硬盘。其中8个磁盘柜用于存储数据,1个磁盘柜用于存储元数据。上层使用的是StorNext文件系统。
存储元数据的磁盘柜中24块磁盘的分配情况:8组RAID1阵列+1组4盘RAID10阵列+4个全局热备硬盘。
存储数据的磁盘柜中磁盘的分配情况,每6块硬盘设组建一组RAID5阵列,共32组RAID5阵列,32组RAID5阵列分为2个存储系统。


存储及文件系统架构大致如下:





注:Meta_LUN(元数据卷)    Data_LUN(用户数据卷)


服务器故障:
存储数据的磁盘柜中由RAID5阵列组成的1个存储系统中的一组RAID5阵列上的2块磁盘由于故障先后离线,该组RAID5阵列瘫痪,导致整个存储系统崩溃,无法使用。


服务器数据恢复过程:
1、对用户存储环境以只读方式做镜像备份,后续的数据分析和数据恢复操作都在镜像文件上进行,避免误操作对原始数据造成二次破坏。
2、在备份过程中发现故障RAID5阵列中的1块离线硬盘存在大量坏道,无法继续正常备份。由硬件工程师对故障硬盘进行开盘更换固件并修复,修复完成后该硬盘可以继续备份,但坏道仍然存在。
部分镜像文件:









3、分析故障RAID5阵列,获取RAID相关信息,利用获取到的RAID相关信息虚拟重组RAID阵列,将重组出来的RAID阵列中的LUN导出为镜像文件。分析过程中发现损坏较严重的硬盘为后离线的硬盘,此硬盘存在大量坏道。
4、登录昆腾存储设备的管理界面,获取StorNext文件系统中和卷相关的基本信息,如下图:





5、分析StorNext文件系统中的Meta卷和Data卷。该StorNext文件系统包含2个Data卷,每一个完整的Data卷都是由多组RAID阵列中的LUN组成。北亚数据恢复工程师通过分析这些LUN研究出LUN之间组合的算法规律,然后虚拟重组出完整的Data卷。





6、分析Meta卷中的节点信息和目录项信息以及Meta卷和Data之间的对应关系,针对一个Meta卷管理多个Data卷的情况,北亚数据恢复工程师研究出Meta卷到Data卷的索引算法。


文件节点:





目录块:







7、通过分析研究获取到工作所需的全部信息后,北亚数据恢复工程师编写程序扫描Meta卷中的节点信息和目录项信息,解析目录项和节点,获取到完整的文件系统目录结构并解析每一个节点中的指针信息,然后将这些信息记录在数据库中。


文件信息:





8、北亚数据恢复工程师编写文件提取程序,读取数据库,根据解析出的信息以及两个Data卷之间的聚合算法提取数据。
9、对提取出来的数据进行抽检,没有发现问题。
10、将用户所需全部文件提取到本地,交付给用户亲自验证,经用户反复验证后确认数据完整有效。
阅读(159) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~