所有的公司都有一件相同的事情——它们都产生许多的数据,包括客户信息,产品信息和账户文件。事实上,许多公司每年的内部数据的大小都是翻倍的。对于增长这么快的数据也给数据保护(包括意外删除、灾难、遵从法规要求的长时间保留)带来了极大的挑战。在过去,数据的保护和保留都是通过将复制或移动到磁带来完成的。但是磁盘存储的改善和归档解决方案的出现提供了为数据保护提供了新的选择。
备份
备份技术已经很长时间为企业提供有效的恢复方案,它能使系统免于由人为失误、硬件失败、自然灾难而导致的数据丢失。他们能够完美的应用于大数量级的丢失数据的快速恢复,同时可以在很短的时间内恢复全部系统到完全操作能力。然后,备份对于存储管理员来说也是一个很大的缺点。因为大规模的数据容量让备份架构难以维持。根据Gartner公司的调查显示,数据中心只有平均87%的备份成功率,而成功恢复数据的比率则更低。
当前,备份数据需要的时间是正在缩小的,而快速恢复数据的性能也有了极大的改善。同时通过有效的将备份应用于磁盘和磁带中,公司可以在一个合理的成本下增加灾难恢复架构的吞吐率和可靠性。而进一步的加强传统备份的复制能力将帮助解决更加恶劣的数据保护要求。然而,如果需要备份的数据的增长率不受控制的话,这些技术也只能治标而不能治本。如果一个公司将备份作为数据保护和保留的唯一解决方案,那将产生极大的风险,同时也会导致非常低效的数据管理。
比如,许多企业习惯于每晚做一次增量备份,每周一次全备份,然后将备份数据保存三个月以防意外删除。然后在其他的地方做第二个数据复制以防止灾难。如果你为了满足数据保留的而要求,而需要将备份数据保存几年,你将极大的增加你的备份的费用。数据的增加就是导致花费的增加,特别是考虑到时间、金钱和人力成本。
我们来假想一家公司比如ABC公司,它在文件服务器上有10TB的产品数据。公司的政策市每天在磁盘上一个增量备份,每周在磁带上一次全备份。这些磁带上地数据将维持三个月的时间直到被清除。然后新公司管理规则与政府的法规不一致,所以新的政策指出所有与季度财报结果相关的数据都必须保留五年。因为ABC没有在网络上将不同类型的数据分开,所以所有的数据都必须保留五年。因为有10TB的产品数据,ABC公司的备份数据将添加到2.5PB。这还没有考虑数据的增长。为了将磁带上每周的数据保留五年,ABC公司将花费大量的时间和资源来做数据备份。
文件归档
通过介绍文件归档,企业可以减少备份成本的同时改善备份和恢复的服务级别。同时文件归档也能满足数据保留的法规要求,它将完全知道文件系统,文档的元数据和文件内存的知识来管理文件。一个文件存档系统通过实际包含的内容来移动或复制文件。它们也能通过基于内容来查找和恢复单个文件,通过任意数量的限制条件,比如作者,数据和常用的标签比如“听众”或者“刘德华”。
为了有效的管理数据,文件归档系统能查找网络上地所有文件并提供一个非结构数据的清单。在获取数据的过程中,系统收集文件系统的元数据,提取文件内容,构建数据分类的依据和数据管理规则的应用。
一个文件归档系统必须有如下的特征:
·基于内容。比如,它应该将文件的内容作索引,而不仅仅是文件系统的元数据。
·从内容中提取信息来得到定制的元数据标签
·通过使用政策来将数据分层存储来减少存储量
·归档的数据子集(由归档政策定义)的选择能够满足法规条文和公司信息管理规则
·能够快速获取归档数据
我们再来看一下ABC公司。ABC公司认识到潜在的数据问题,然后配置了一台文件归档产品来加强它现存的备份系统。这个文件归档设备能够连接整个网络并为每个文件创造元数据抽象,这个元数据抽象包含文件系统元数据,文档元数据,自动的用户数据。这个产品中70%的非结构产品数据都是过时的(不是在之前90天获得的)以及5%的非结构产品数据和季度财报相关。
因为能够通过商业价值来设置政策进行分类,管理和恢复数据,文件存档应用可以用在任何多个的真实世界中,它是智能的,同时能够快速的获得归档在一个分布式的存储平台上的数据。
文件归档产品的主要应用包括法规规定,法律查找,公司规则和分层存储。
结论
文件归档和备份系统在一个企业中有两个不同的功能:备份为了高速的拷贝和恢复以最少的减少失败的影响,人为错误和灾难;文件归档则有效的管理数据为了保留和长时间的获取和恢复。这两个能力能够一起减少花费同时改善存储架构的全局效率。备份在一个有归档的解决方案中将变得更有效率,而归档同时可以利用备份的架构为了获取它自己的数据保护需求。两个应用对一个高效的数据管理策略都非常重要。
阅读(1903) | 评论(0) | 转发(0) |