俗话说的好,正常的服务器都是正产运行的,不正常的服务器却各有各的故障。作为一名从业了十多年的服务器数据恢复工作者来说,近些年来遇到的服务器数据恢复案例中故障情况大多相似了,没见过的故障越来越少,我想一方面是自己从事服务器数据恢复工作的时间越来越长,一般的故障都见识过了,另一方面是服务器厂商对产品的安全性能不断优化的结果。不过虽然导致服务器数据丢失的故障情况比较单一了,但是服务器数据恢复的案例却并没有明显减少,今天还是通过一个近期处理的服务器数据丢失案例来为大家介绍一下服务器硬盘掉线的数据恢复过程。
首先介绍故障服务器基本状况,出现数据丢失的服务器里面是一组raid6磁盘阵列,阵列包含8块硬盘,单块硬盘的容量是500G,服务器是一台web服务器,主要用来运行数据库,另外一部分空间用来存放普通办公文件。由于管理员疏于管理也或者是存在侥幸心理,在这个阵列中已经有两块硬盘离线的情况下依然没有对服务器进行更换硬盘,很快阵列中又有一块硬盘离线,而这最后一块离线的硬盘就成了服务器崩溃的直接原因。
在我们接到客户这台服务器之前已经有过一家北京的数据恢复公司对服务器进行过数据恢复操作了,恢复了大部分的数据,但是数据遭到严重损坏无法使用,办公文件也有近40天的数据丢失,于是该数据恢复公司只好推荐了我们,客户带着服务器来到我们公司进行第二次数据恢复尝试。
我们的服务器数据恢复工程师简单了解了客户的服务器故障情况后首先将所有硬盘镜像到数据恢复安全存储池中,虽然不确定上一家数据恢复公司是否也做了同样的操作,但是为确保数据原始性,我们还是必须要对客户原始服务器进行镜像操作,一方面是对我们数据恢复公司自己负责,另一方面也是对客户数据的负责。
接下来服务器数据恢复工程师对可恢复服务器的镜像文件进行分析发现阵列内最先离线的两块硬盘离线时间非常早,至少有2个月不再有新的数据写入了,所以数据恢复的关键点就落在了这最后一块离线的硬盘上面了。客户的这台服务器阵列使用的双校验,但是由于有两块硬盘长时间处于离线状态,普通的异或运算已经无法对服务器进行数据恢复,只能使用基于Reed-Solomon算法生成的第二种校验方式进行恢复数据,这种数据恢复方法目前还属于我们公司的核心算法之一,市面上也并没有与之相似的其他算法和软硬件产品,所以这也是上一家数据恢复公司没有能够成功恢复数据的根本愿意你了。
既然是核心算法,那么我就不详细描述我们分析和恢复数据的过程了,服务器数据恢复工程师们编写了一个通用的小程序将被破坏的数据进行了重组和提取,然后生成为完整镜像,在安全存储池内对恢复出的数据进行验证没有问题后联系客户来进行最终验证数据。经客户最终验证,该服务器内所有数据全部恢复,数据库可以正常使用,本次服务器数据恢复100%成功。
阅读(1190) | 评论(0) | 转发(0) |