Chinaunix首页 | 论坛 | 博客
  • 博客访问: 11624075
  • 博文数量: 8065
  • 博客积分: 10002
  • 博客等级: 中将
  • 技术积分: 96708
  • 用 户 组: 普通用户
  • 注册时间: 2008-04-16 17:06
文章分类

全部博文(8065)

文章存档

2008年(8065)

分类: 服务器与存储

2008-06-03 16:31:36

为了得到更高的存储利用率,存储管理一直在进步。在2008初,我们回顾了过去一两年的存储管理,我们发现其中最主要的变化就是企业开始采取集中化的存储策略代替老的分布式策略。与此同时,存储层级化、管理工具的升级和虚拟化的发展也都方兴未艾。本文中,我们将分别予以分析,并且给出相关建议。

六种方式推进存储集中化

    现在,我们开始认为存储中心化管理能够带来许多好处,可以削减成本,简化存储管理,也增加了灵活性。但以往的情况并不是这样:一个企业总是有多个业务部门,部门之间的存储需求差异较大,所以存储主管不得不单独分配存储资源给每一个业务部门。

    如果将存储架构从分布式调整到集中式,会怎么样呢?这个过程需要整个企业内部,重新分配不同级别的存储服务。通常而言,存储集中化的过程往往需要企业花费数年时间的努力,并且这个过程需要克服人员、程序和其他技术困难。所以就目前而言,并不是所有的IT经理都对此做好了准备。在很多案例中,存储集中化使整个企业做了大量的系统修补。

    虽然过程可能艰难,但对于存储集中化能够带来的好处,各个企业的管理层似乎都非常肯定。但是下到企业的各个业务部门,这个观点就有所不同了——IDC的架构服务研究主任Doug Chandler表示“毕竟每个业务部门都更关心自己的IT利益,对于整个企业的存储流程和费用的关心就差很多。所以,各个业务部门对于存储集中化有着普遍担心:存储集中化之后,他们是不是还能够拥有同样品质的存储。”

    因此,对存储集中化,我们需要六种方法来推进。
    ● 设立目标:从一开始,就要建立合理的最终目标。因为重新改造存储至少要花掉你数年的时间,所以为每一个存在的“存储仓库”定义一个具体的改造时间表至关重要。
    ● 金钱考量:让企业内部每个跟存储相关的人都知道当前昂贵的存储费用,与他们充分沟通,让他们知道你的想法,他们才可能支持你。否则,存储的浪费仍将持续。
    ● 定义程序:定义良好的程序,这些程序应该能够应对存储中心化过程中的各种问题。
    ● 不断线:HA(High Availability)和足够的冗余能够确保连续的存储服务。
    ● 整合管理(Consolidate Management):一个存储应用应该能够向所有的存储管理员提供同样的简单的方法来管理各种任务,这种存储应用是存储效率提升计划的关键组成部分。
    ● 虚拟化:采用虚拟化来简化存储,提升效率。

    在存储架构从分布式转向集中式的时候,与业务部门充分讨论,是一个很重要的因素。分布存储向集中存储迁移这个主意,最初多是由IT部门提出来的,以便得到更低的预算和更高的灵活性。国家医药卫生卡片系统(NMHC System)的技术副总裁Mark Deck表示“毕竟,IT管理员的职责就是提升ROI(投资回报率)。变革发生时,他们应该尽量说服一线的各业务部门的执行人员。”随着集中化存储过程的推进,业务部门的存储团队将可能越来越多的扮演IT管理员的角色。Deck认为“过程的最开始,所有的IT管理员都感觉他们所在部门的职能范围被缩减了。”

    另外,跟“存储仓库”不同,集中式存储需要更强大的程序。集中式转变的过程涉及定义、重新定义,和采纳多个能够管理存储各个层面的程序:这个转变过程需要全面重新审视存储,从存储怎样被要求,被部署,被备份,和被监控开始,到新架构的预算及其分配。其实过程中最难的部分,还并不在于重新设计或者程序问题,而是得让人们从心底接纳并且遵守新技术。StorageIO集团的创始人兼高级分析师Greg Schulz这样表示“对于企业而言,存储架构的变化就意味着企业文化的改变。实际上,这个改变总是需要时间来贯彻,而且只有当基层的执行雇员真正拥护新架构的时候,新架构才能够发挥作用。”

    公司一般都需要花上数年时间才能将存储架构彻底转变。Deck表示“存储架构的转变,在我们公司一共花费了两年半时间。不过假设旧的存储孤岛没有充分折旧,那么存储集中化的计划就显得非常昂贵了。”

    对于长期计划而言,集中式迁移费用的多少也是非常关键的。惠普存储海外市场经理Nimish Shelat,经历过很多公司的存储集中化的过程,他就表示“如果一个存储计划要很多年,人们就总是会很怀疑这个计划到底能不能真正持续。所以,一个计划应当有详细的进程规划,并且划定不支持存储孤岛的时间,告诉人们这次是动真格的了,这样人们才会积极的推进新的存储方案。”

    尽管存储集中化的过程可能会遇到很多问题,IT管理员还是应该不遗余力的推进,过程中也应该确保程序持续提供服务,而不会因为迁移而中断。如果一切推进的还算顺利,我们很快就会发现集中化存储有一个现象非常有趣——孤岛存储时,存储预算多为每个业务部门独立核算,而到了集中化存储时,存储资源共享,对于每个业务部门而言,存储资源一下子变成“免费”的了。所以每个业务部门都争相将有用的,没用的数据进行存储操作,这导致了大量的磁盘浪费,反正存储是“免费”的,所以为什么不多存一点呢?Deck表示“自从我公司集中化存储以来,我们对付的首要敌人就是各个业务部门对待集中存储的态度问题。业务部门不直接付费,他们使用的空间增加太快了。”教育业务部门节省集体资源,是一项漫长的工作,你需要向部门展示详细的存储费用单据,有时甚至要让业务部门自行付费,才能逐渐板正这个问题。StorageIO 的Schulz表示“如果最终用户自行支付存储费用,用户就变得小心谨慎了。这对于多数雇员的浪费行为有很好的矫正作用。”

付存储费用,用户就变得小心谨慎了。这对于多数雇员的浪费行为有很好的矫正作用。”

持续可用性是存储集中化另一个关键

    另外,如何确保存储系统的持续可用性,是集中式存储面临的另一个关键问题。从存储控制器、磁盘和RAID到服务器以及连接,存储架构的各个方面都需要以冗余为基础重新设计。备份和灾难恢复也需要被嵌入到架构之中,这样存储服务才能够有最短的服务中断。恢复时间目标recovery time objectives (RTOs)和恢复点目标recovery point objectives (RPOs)也一样重要。

    除了存储硬件需求,企业也需要集中化的存储管理模块软件,软件应该能够有效的管理、监控、分析非分布式存储架构。Deck表示“我们比较了一番,最后选择了惠普的Storage Essential来,我们认为这款软件更适合我们的现状。作为单一存储任务管理工具,这款软件可以使我们简单方便的观察存储架构的各个方面。

    这款软件也确保了所有的存储管理都以同一种方式执行。”其实,存储管理软件并非只有惠普。在存储资源管理应用storage resource management (SRM)领域 ,比如像EMC 的ControlCenter,HP的 Storage Essentials,Symantec 的 Veritas CommandCentral Storage等等做得都不错。这些软件都试图以自己的能力处理所有的存储管理问题。

    而另外,也有一些小一点的软件,它们对集中式存储环境更有针对性,在一定程度上可以补充全能型的SRM软件。这些软件主要包括:Akorri公司的BalancePoint,主要用于存储表现管理;MonoSphere公司的 Storage Horizon,主要用于存储容量管理;Onaro公司的SANscreen,主要用于SLA(服务水平协议)和改变管理;TeraCloud公司的Storage Analytics则主要用于存储效率分析。这些软件是存储管理工具的一些例子,其实像这类的软件还有很多。究竟部署哪一个,还需要取决于企业的具体存储环境。

    除了简化管理和企业存储标准化之外,我们努力提升存储效率的最大原因是费用的节省。DAS、SAN和NAS孤岛的缺陷在于这些磁盘和阵列只专注于单一的服务和业务部门。不管有多少可用的空间在这个存储孤岛上,都难以被其他部门使用,这就导致了存储效率低下。而集中式存储则提供了一个足够大的存储资源池,资源池给每个部门分配空间,空间大小完全取决于部门需要多少空间。“而此时我们可以方便的将存储利用率从低于60%,提升到超过90%。”Deck表示。

    决定存储系统当中到底应该保留多少额外空间,每个公司都有自己的决定。而这个决定一定是基于公司的存储空间的增长历史和未来的存储预测。米歇根州底特律健康联盟计划的信息架构主管Dan Trim表示“在过去,我们采购存储设备,95%的时候非常被动。存储孤岛的情况使得我们不清楚到底缺多少设备。而现在我们采购存储设备,95%的时候是主动的。目前,我们很少突然被迫采购存储设备。”

存储层级化

    通过考察实际需求而增加存储利用率,可以节省大量的存储费用,同时存储费用也可以被存储层级大幅削减。存储层级可以在存储资源池中根据表现、服务水准、和费用,而划分出不同的相互隔离的级别。目前流行的方法是3个层级的存储。当然,存储层级的个数,大小等其他具体因素还是取决于存储环境的实际需求。例如国家医药健康卡片系统存储系统的65%的空间是Tier 1,因为数据库应用需要比较大的空间。相反的,存储资源如果多用于大量的文件,那么存储系统倾向于拥有更大容量的Tier2和Tier3。

    值得说明的一点是,存储层级其实是相对的。比如,一个公司Tier 1存储在做的工作,在另一个公司可能由Tier 3来完成。EMC 的市场主管Kevin Gray表示“层级是非常客户化的,一些客户将Clariion作为Tier1,另一些则将Symmetrix作为Tier1。”尽管存储层级的情况在不同公司各有不同,存储层级Tier1,却有着共同的特点。典型的Tier1是有着高表现、高可用、高可扩展性而且也是高价的。Tier1 存储可以提供很多领先的特性,比如多种支持接口,克隆、快照、同步或异步复制。现在主流磁盘阵列厂商都支持3层级的存储方案,其中的高端磁盘阵列一般都去担当Tier1的工作。目前能够担当Tier1的高端磁盘阵列主要包括EMC Symmetrix,,日立数据系统的TagmaStore Universal Storage Platform,和惠普公司的StorageWorks XP。

    这些一流的磁盘阵列构成了Tier1,而同时Tier1也被要求提供更具优势的存储、恢复和容灾备份服务。恢复和容灾的目标各个公司有所不同,但是Tier1在各个公司都处理着关键应用,而且都要求零宕机服务。因此,Tier1使用快照、复制、和连续数据保护提供了实时备份能力,这样使得Tier1有所提升,性能上更加接近理想的即时恢复和任意时间点恢复。对于关键应用而言,同步复制到次级磁盘阵列或者架构群集中的节点可以提供零宕机的连续失效援备(failover)。

    由于Tier1的责任重大,所以Tier1经常由高端的光纤阵列组成,以便企业资源计划系统或者数据库等关键应用良好运行。Tier2则通常拥有低一些的可靠性,速度和价钱也都比Tier1要低。Tier2常用于次要的应用,这些应用不需要那么高的表现。而Tier3则一般是由容量很大的,廉价的磁盘构成。比如SATA磁盘,通常被用作文件、文档存储。

    NMHC系统的Deck也部署了三层级的存储架构,该架构提供了上述服务等级。NMHC的采购基本都是HP的产品——Tier1采用HP 的StorageWorks XP;Tier2采用基于光纤驱动的HP Enterprise Virtual Arrays惠普企业级虚拟阵列 (EVAs);Tier3采用的是HP StorageWorks 1000模块化小型阵列(MSA1000),基于SATA驱动。

    Deck表示“其实,我们计算下来,Tier1的每月每GB费用为7美金;Tier2每月每GB费用为3美金;Tier3为1美金。而我们的用户总是倾向于索要更多的空间,所以我们不得不将他们要求的空间与费用挂钩。其实每个使用者都希望用Tier1处理所有的应用和存储,而只有当我们为每个存储标价之后,企业内的使用者才可能收敛一些需求,并且按照他们的实际需求来分配应用到存储层级。”

    存储层级当然削减了很多存储费用,但是存储层级本身还不能阻止普遍的Tier1的滥用现象,毕竟谁都希望使用高性能的Tier1。针对Tier1滥用,很多厂商都提出了解决方案,用数据迁移和信息生命周期管理工具来共同决定数据应该处在的层级,并且自动迁移这些数据。

    比如说,我们事先设定,如果文件3个月不被使用,就被移动到Tier3上,或者清除其某类文件的冗余拷贝。这样的方案似乎非常不错,不过目前还不够成熟——比如在不同厂商的产品之间迁移数据,现在还是会遇到很多问题。另外,因为文件在层级之间来回移动,导致了为每个业务部门计算存储费用的工作也变得很困难。不过,一些SRM工具还是可以准确计算复杂情况下的存储费用,比如EMC ControlCenter 6.0。

阅读(1848) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~