Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1226407
  • 博文数量: 727
  • 博客积分: 10011
  • 博客等级: 上将
  • 技术积分: 8320
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-13 15:42
文章分类

全部博文(727)

文章存档

2011年(1)

2008年(726)

我的朋友

分类: 服务器与存储

2008-07-13 17:14:43

数据存档已成为存储基础设施的核心问题。目前,存档有两大目的:一是保留大量不经常访问的数据,二是保留(随后删除)相关数据,满足法规遵从的需求。

  然而,存储区域网路(SAN)存储强调性能,存档存储依赖低成本、高容量的SATA驱动器,采用RAID恢复技术和传统的备份技术保护磁盘免受损坏。一些存档只是稍优于“笨拙的”磁盘阵列,而一些复杂的存档则可以提供数据重复删除技术,支持单例存储、电力保护特性和数据一致性。

  存档存储中采用硬件只是其中的一项挑战。软件在大量的存储任务中发挥核心作用,包括优化和组织访问邮件记录,在成千上万的文件中实现数据索引和检索,制定文件处理策略等等,这些都是为存档过程中迁移和保留数据做好准备。


  我们首先来看看评价数据存档产品的八大标准。

  哪些数据需要存档?并非所有的数据都需要存档。在购买存档产品之前,你应该对数据进行分类,这样你就会了解你的公司有哪些数据,哪些数据需要存档保护,以满足法规遵从,哪些数据公司每天都要用到。数据分类工作不应该仅仅应用到IT部门,人力资源、法律部门、财务部门等其它重要部门了解重要的应用程序和文件种类。邮件服务器记录、病历、医学图像文件都应该存档,但是市场调研报告、用户mp3文件就不需要存档。另外一个问题,每种数据类型各自应该保留多久。了解你需要保存哪些数据、保存多久,这将帮助你决定存储需求,设置存档管理工具的大小需求。

  存档产品能满足保留和删除需求吗?如果没有审核存档产品的数据保留和删除行为,你就无法评价其优劣。存档工具、支持存档的软件都必须在一定的保留期内正常工作。数据保留期通常等于文字记录和文件的保留期。例如,如果文字工作记录需要保存七年,那么相应的电子记录也应该保存七年。保留数据要注意以下四点:

  1、确保采用正确的数据删除方法。
  2、不要保存删除后日期的数据(除非用于诉讼目的)。
  3、保证数据删除方式遵从环境要求。
  4、改变保留期会影响已经存档的数据。

  集成和自动化的程度如何?存储管理员不可能手动迁移、追踪、删除每个文件。任何存档产品都必须具备自动功能。索引工具应能自动给文件添加有用的元数据,并与检索工具集成;检索工具能通过元数据定位用户请求的文件。策略管理器应能根据文件类型迁移和保留数据,而将数据类型局限于一定的存储级别。这样,管理器就能移动数据,在存储层之间迁移年代久远的数据,也能实现保留和删除等功能,不过还需要与其它工具集成才能达到这些目的。

  互操作性和异构性如何?新的存档存储系统必须能与策略管理器、数据迁移器等工具实现互操作,如法规管理和数据迁移以及新的软件应该提供当前存档硬件所需的异构性。存档硬件和软件的自动化特性必须完美结合。在这里实验室测试相当重要。

  存档技术、介质、工具的寿命。存档面临长期标准化和自然介质退化的问题。介质的数据保存期可能只有10年,今天录制的磁带可能在20年后的标准磁带驱动器中无法读取。光盘(CD和DVD)及其他的磁盘驱动器都存在类似的问题。公司都面临一个困境:是保留旧设备,以备读取旧介质之用?还是定期更新数据(例如,重新刻盘或硬件驱动),使任何新介质都能读取数据?保持软件的向后兼容性比较容易,因而改变工具也能读取旧介质中的存档数据。2028年发布的邮件存档软件版本可能无法读取今天制作的邮件存档。

  备份战略。存档不是备份。在公司中,位于磁盘存档中的文件可能是唯一的数据复本。磁盘存档依靠RAID技术保护数据,备份过程通常包括存档平台。已经建立的存档可能每隔几个月就会完全备份到磁带中,平时(每天或每周)应该采用delta差异备份,保护存档数据的变化。数据重复删除等数据压缩技术可以减少存档总量,加快备份速度。最重要的一点:找出哪种方法能最有效地保护你的存档数据。

  追踪和报告特性。追踪文件行为、并报告给存储管理员,这一点至关重要。在某些情况下,追踪和报告只能帮助管理员了解存档中保留的大量文件发生的正常变化。而在其它情况下,追踪和报告是存储遵从性的必要组成部分。追踪和报告的内容可能包括:追踪存储层之间的数据迁移,标识检索和访问行为,了解哪些用户试图查找数据,提醒IT人员哪些存档数据发生了变化,报告文件的删除活动,了解废弃数据的配置情况。

  维护和TCO。最后,任何存档平台和存档工具的费用都要高于当初的购买价。硬件平台需要常规的维护费用和潜在的更新费用。软件工具每年都需要许可、补丁和升级等费用。存储管理员可以估计总体拥有成本(TCO),具体比较各种存档产品的价格。

阅读(425) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~