Chinaunix首页 | 论坛 | 博客
  • 博客访问: 829914
  • 博文数量: 850
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 9960
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-04 11:03
文章分类

全部博文(850)

文章存档

2011年(1)

2008年(849)

我的朋友

分类: 服务器与存储

2008-07-04 13:08:53

数据重复删除

    “数据重复删除是近年重要的技术。”GlassHouse的Preston表示“数据重复删除定义并且删除了许多数据拷贝,那些重复的数据占用了大量的空间,而且还延长了备份时间。”通过减少大量的数据存储,数据重复删除解放了容量和带宽,同时也减缓了公司新增存储设备的需求。更少的存储设备又意味着更低的开销,还有更低的能源消耗。

    Integral Capital Partners是一家私营投资公司,已经转向了数据重复删除,来加速其隔夜备份。公司操作的设备分布在两地——Menlo Park 和Baltimore,每个地区存存储本地数据,而晚上则在两地之间复制数据。“这个过程一般将持续8小时” 信息系统管理员Jason Paige表示。Jason Paige在2007年早些时候开始寻找更好的解决方案。但是他没找到什么“我不希望磁盘像磁带一样工作。”他表示。

    最终,他找到了Avamar,这是一家EMC旗下的公司,Avamar将文件切成碎片,再由这些碎片申请数据重复删除,从而只传输变化的数据。通过T1线路,Avamar每天晚上复制300GB-500GB的容量,而Avamar本身就可以存储2TB的容量。“通过数据重复删除,我们可以将我们的备份时间压缩到45分钟。”Paige表示。

    “数据重复删除,也是一个改变策略的技术。”Taneja 咨询集团的创始人Arun Taneja表示,“这项技术已经可以使每个VTL都包括数据重复删除。”尽管数据重复删除看起来非常有发展,不过它还是有着一些缺陷“它恢复数据的时间十分漫长。”StorageIO Group的创始人Greg Schulz解释“同时,数据削减也十分依赖你的某些特定数据。”

2008年,一些不成熟的技术

    下面是一些我们觉得还不太成熟的存储技术,我们认为可能在2008年不会普及。

自动存储层级
    自动存储分层通过自动的移动数据从昂贵的存储到便宜的存储层级之上。RobertGrayDirect公司的Robert C. Gray 表示“最困难的地方在于数据分级,因为分级之间的连通可能还有些问题。其实我们还需要很多改进,例如不同厂商的产品之间我们还不能转移数据。而这一点在存储实践中非常重要。”

存储表现报告工具
    一些报告工具可能会将存储资源管理storage resource management (SRM)推向一个新的高度,这些工具可以显示基于不同管理服务的存储的表现。StorageIO 集团的创始人Greg Schulz 表示,“这些报告工具目前比起以往的SRM的确强一些,但是提升的幅度还不够大。我们需要的是真正强大的分析信息的工具。”

栅格存储
    理论上,栅格存储提供了一个可扩展的、高可用的、适应性强的存储环境,其中有可根据需要添加的智能存储隔间。这听起来蛮不错的,但是目前还是缺少栅格存储产品。这些产品来的比蜗牛爬的还慢。所以,各个企业也不再苦等栅格存储产品了,而是转而采用群集来获得一些栅格存储承诺提供的优势(至少是可用性)。

企业加密的秘匙管理
    正如上文提到的,秘匙管理的工业标准非常重要。但是目前还没有一个统一标准。照目前的情况看来,我们估计还需要等到2009年。即便那个时候,我们还需要时间来将标准普及到各个产品当中。Schulz认为“每个厂商现在都有自己的迷匙管理标准,这实在是不应该,这种各自为政的现象很幼稚,损害了所有厂商的共同利益,但是目前还没有大厂商真正扛起标准的重担。”

磁盘备份到磁带
    磁带不会消失,这一点好像也不算是什么新闻。而磁带和磁盘之间的中间部分,发展确实也比较迅速。跟D2D的离线存储一样,Disk-to-disk-to-tape (D2D2T)已经开始变得越来越流行。Integral Capital Partners 的Jason Paige说“通过磁盘磁带之间的复制,我可以备份全部100%计算机的内容而不用磁带。如果有谁问起我们的备份,我就直接告诉他我们采用离线存储,他们也接受了这一点。”

Ediscovery

    如果你还没有接受ESI电子存储信息(electronically stored information )概念,那么你将来可能在法律诉讼上吃大亏。因为根据最新的美国法律FRCP,ESI已经拥有了与传统纸媒一样的法律地位。

    Ediscovery是一个过滤ESI的进程。现在,只要诉讼被归档,组织就必须保存、保护所有相关的数据。“在FRCP上的改变很快导致了人们对Ediscovery的浓厚兴趣。”Socha 咨询公司的创始人George Socha表示“Ediscovery工具和服务也同时处理了相关的进程,比如法律保证管理——这对于保护ESI在诉讼中至关重要,包括了保持管理(retention management)、案例管理、工作流(workflow),另外还有文档管理,这涉及了整个诉讼的流程。

    Socha出版了ediscovery的年度报告,而且追踪了其中的厂商。“至少,有600个组织提供了ediscovery服务或者产品。”Socha表示,“其实统计上共有800多家,但是其中一些已经消失了。毕竟破产或者业务转向每年都在发生。”

    Socha的年度报告,在相关研究匮乏的情况下,在ediscovery领域有风向标的作用。这份报告里的顶级厂商包括了Guidance Software、Kroll Ontrack、Zantaz(最近被Autonomy收购)等等。而其他的顶级厂商如Index Engines Inc.、Kazeon Systems Inc.,等公司则可能更为我们所熟悉,可惜都没有出现在Socha的top20中。

    Onsite3,一个美国弗吉尼亚州的ediscovery服务提供商在Socha的名单里排名第18,这家厂商使用了目录引擎工具来寻找被埋没在磁带之中的关键数据。“目录引擎让我们有能力索引整个磁带,而不用恢复磁带。我们只需要恢复我们需要的文件就可以了。”Onsite3的电子证据实验室主管Jeff Fehrman这样表示,“比较恢复整个磁带的方法,目录引擎减少了很多数据恢复的时间,而且恢复的数据量可能仅为原来的1/10。我们有医药和金融客户,他们需要搜索成千上万的磁带。”

    TiVo公司也开始使用Kazeon公司的产品,来进行法律层面的自我防卫。“我们发现在管理不善的情况下,ediscovery会很昂贵。”TiVo的法律事务主管Karen Kramer表示“不过部署了Kazeon,我们的费用和任务量都小很多了。”TiVo在自己的服务器上运行Kazeon,使用它来处理跨Unix、Windows、Mac和Linux的ediscovery事宜。Kramer表示“Kazeon采用了许多信息资源,并且将这些资源集成到一个搜索当中。一些别的厂商的ediscovery需要单独的服务器,而我们目前所采用的方案,是集成在自己的服务器之上的方案,所以费用方面会有所节省。”

绿色存储

    Uptime公司的首席能耗策略师Bruce Taylor表示“绿色存储并不仅仅是一时流行。在未来三年中,能耗费用将可能超过服务器和存储设备的购买费用。以往,跟服务器相比,存储设备似乎并没有太多的能耗问题,不过随着存储需求的日益增加,能耗也将变成存储的一个重要的问题。”

    存储工业目前还没有开始认真思考能耗问题,也没有认真的问上一些简单的问题“为什么我们必须使用磁盘来存储,为什么不多用磁带?”Taylor认为,IT必须重新思考自己的数据存储策略。

    减少存储能耗的方法
    ● 转换成容量更大的磁盘
    ● 使用速度更低的磁盘(7,200 rpm 和10,000 rpm)
    ● 增加磁盘利用率
    ● 通过数据重复删除和压缩减少数据卷
    ● 将较少使用的数据转移到磁带
    ● 尽量用磁带备份,而不是磁盘
    ● 虚拟化和合并(consolidate)存储
    ● 非活动磁盘阵列massive array of idle disks (MAID)分配给近线归档(nearline archiving)
    数据来源: Stanley Zaffos, research VP, Gartner Inc.

    在Epilepsy Phenome/Genome Project (EPGP) 癫痫基因/表现体项目研究的管理员开始计划数据中心的合并的之前,他们心中并没有一个能耗概念。Michael Williams作为项目的CIO,表示“我们有很多站点。我们的DAS平均利用率仅为40%,我们浪费了很多服务器和存储资源。”该组织随后合并了数据中心,部署了虚拟化和自动精简配置。在过程中,10架(10 racks)服务器被合并为两架,采用了两个数据重复删除的存储池,又将每个150TB的存储池缩减到25TB。这无疑是惊人的提升。

总结:

    如果你不愿意在今年部署任何一项新技术,这当然可以,但是你不可以排斥新技术。因为不管我们是不是愿意,绿色计算、诉讼和数据加密等技术还会继续发展。而数据重复删除、NPIV, LTO-4和ediscovery正是各种新技术的载体。当然,我们绝对不希望你被卷入一场法律纠纷、不小心丢失了备份磁带、或者你的能耗费用超标,所以我们向你介绍上述技术。最后,我们衷心希望这些技术能在2008年帮到你的忙,让你更好的处理各种问题。

阅读(343) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~