6. 逻辑磁带格式
除了前面所讨论的由驱动器制造商决定的物理磁带格式外,还存在另一种磁带格式,即逻辑磁带格式。它是建立备份软件的基础,逻辑格式产生更高级的结构,用于备份软件组织数据。逻辑格式决定下列组成部分的大小和位置:
•头信息,包括电子形式的磁带名字或标号。
•为了快速地定位备份数据集,所形成的索引信息和位置“标记”。
•备份数据集,包括可能交叉的数据。
•错误编码和统计。
逻辑磁带格式的主要任务是正确地定位磁带上的数据,定位数据最常见的方法之一是:在磁带的开始保存一个索引,标识数据集在磁带上的位置。数据集是一个文件或者一组文件,它们是作为单个备份作业的组成部分一起拷贝到磁带上的。例如,从服务器上一个特定的磁盘卷拷贝的文件可以形成一个数据集;与此相反,当恢复文件的时候,首先通过读取索引数据,然后由此确定数据集的位置,最后定位单个数据文件在数据集中的位置,实现对它的恢复访问。实现磁带上的信息组织和数据访问方法有许多,图7 - 8是一种可能的信息结构。
通常,逻辑磁带格式的索引单元是一段固定长度的磁带块,可以记录许多数据集。当磁带上写入新的数据时,就需要更改索引,以反映新的数据集的存在状态和位置;当数据为后来的备份数据所覆盖的时候,索引也要更新以表示新的数据集。由于这个原因,索引经常为备份和恢复操作使用,因此,它是读/写操作最经常发生的地方,磨损也是最快的。
目前使用的几个流行的磁带格式包括:由几个厂商使用的UN I X 磁带归档和恢复(TA R )格式;备份和恢复Wi n d o w s 系统使用的微软磁带格式(M T F);N e t Wa r e备份系统通常使用的系统独立数据格式(S I D F);L e g a t o系统使用的Open Ta p e 格式,它可以提供给其他公司使用,但基本上被其他备份厂商所忽视。许多年来,C A / C h e y e n n e公司拥有自己专用的磁带格式,但在其基于Wi n d o w s 的产品中已经开始使用M T F格式。
多种磁带格式可以使用在不同的平台上,这意味着,在一个平台上产生的磁带,也可能在另一个平台上读出。建议读者向厂商询问有关跨平台磁带格式的兼容问题。
7. 备份系统的数据库或元数据目录
不管通常的感觉如何,网络备份系统的实际核心是其内部的数据库,有时候也称为元数据或目录。在大部分情况下,“目录”一词是指某些特定备份操作的一组记录,如备份的内容、所使用的磁带等。
另一方面,备份系统数据库也指某种类型的关系数据库,使备份的信息视图建立在多个索引上,包括文件名、文件创建的日期和时间戳、磁带名、存储池名、备份日期、文件拥有者信息等。根据备份和存储有关备份数据元数据的能力,各个备份系统的实际视图可能差别很大。
由于数据库系统能够为备份程序提供各种功能,特别是恢复功能,故它是备份过程的中心。通过提供几种视图,管理员能够很快地搜寻要恢复的特定文件或数据库表,而无须扫描备份记录。对于不同的环境,这可以节省数个小时甚至数天的时间。
然而,拥有这种能力并不是没有代价的。为了建立一个数据库,首先必须搜集数据,然后将这些数据放入数据库。就备份而言,因为被备份的对象数目往往很大,导致数据库经常十分庞大。例如,假使在服务器上存有500 000个文件,为了保存每一个文件的记录,在备份系统数据库中至少有500 000个记录,那么,当加入所希望的元数据目录时,容易看出,完整备份5 0 0 0 0 0个文件将会产生一个相当大的数据库操作。为了建立关于这些备份文件的记录,事务处理需要花一个小时或者更多时间,再乘以1 0个或者更多数目的服务器,明显地可以看出,处理备份数据的元数据是多么艰巨的一个任务!
当备份在介质上的每份拷贝都有一个记录时,情形将变得更为有趣。试想系统上的每一个文件有1 5个记录,数据库的大小就成为一个问题,这时,备份系统的性能将受到很大的影响,数据库的处理时间也会变得很长。为了缓解这种情况,备份系统提供了一个实用程序,利用它可以从数据库中取消数据记录。删除数据库记录并不意味着磁带上的数据不能恢复,但恢复数据的确需要花费更长的时间。
网络备份系统一般可以从数据库中删除或清除更早的记录,提供维护数据库的能力。虽然这可以帮助管理数据库的大小,但它也意味着,发现不再存在的数据库记录的数据更为困难。因此,提供详细记录选择的数据库维护工具是很重要的,特别是,为了满足数据保存和核算的需求,而必须长时间地存放的磁带。
这里的关键问题是个别备份及需要跟踪的实体数量。相比管理拥有许多小文件(1 0 K B)的服务器,管理一个单独实体的相对大的(5 0 M B)表数据库则显得轻松得多。
阅读(435) | 评论(0) | 转发(0) |