VSAN数据恢复环境:
4个节点服务器组建vsan集群。每个节点服务器上有2组分别由6块硬盘组建的raid阵列,上层是虚拟机文件。
VSAN故障情况:
vsan集群某一个节点服务器上的一组raid阵列中的一块硬盘离线,安全机制启动,开始进行数据的重构及迁移。在数据迁移过程中机房断电导致数据迁移重构失败。服务器重启之后另一组磁盘阵列中有2块硬盘出现故障离线,导致整个vsan分布式存储不可用,上层所有虚拟机无法访问。
VSAN数据恢复过程:
1、将VSAN集群上所有节点上的硬盘编号后取出,经过硬件工程师检测没有发现有硬盘存在硬件故障。以只读方式将所有硬盘进行扇区级的全盘镜像,镜像完成后将所有磁盘按照编号还原到原服务器中,后续的数据分析和数据恢复操作都基于镜像文件进行,避免对原始磁盘数据造成二次破坏。
2、基于镜像文件分析底层数据,分析服务器上层虚拟机所在磁盘位置的分布情况。使用北亚企安自主研发的针对vsan架构下虚拟化数据恢复工具对分析获取到的数据分布信息进行准确性验证。
单独对每个节点服务器上的两个raid阵列进行分析,搞清楚每个raid阵列中硬盘的对应关系。每块硬盘都有一个标识进行磁盘间的对应,根据硬盘的ID信息判读raid阵列中的硬盘ID信息。
3、在每块硬盘上获取磁盘的UUID和raid阵列的UUID。
4、根据每个raid阵列中的容量盘的组件信息获取此容量盘的组件信息。
5、根据组件信息中记录的组件的MAP位置提取组件位图。
6、根据组件的位图提取组件数据和缓存数据。
7、根据组件的描述信息获取组件所属对象及组件顺序,并把组件合并成对象。
8、根据对象,提取数据。
9、服务器数据恢复工程师对恢复出来的数据进行验证,没有发现异常。由用户方亲自验证所有恢复出来的数据,经过仔细验证,确认恢复数据完整有效。本次数据恢复工作完成。