分类: 服务器与存储
2008-07-15 10:38:34
存储资源管理(SRM)多年来一直是IT管理中的一个麻烦问题,在1960年代和70年代存储都是大型计算机中主要的成本组成部分,细心的管理这些资源对于成本控制至关重要。随着硬件成本的不断降低,许多人开始错误地认为:存储设备可以随便使用,而不必担心其开支。现今大家几乎都意识到事实上全不是这么一回事,存储资源管理的问题再次成为焦点。就在不久之前,Wintel服务器(基于Intel芯片的Windows NT服务器)通常所需的存储容量尚不足以对成本造成冲击,同时也无需进行周密管理,只要做做基本限额配置、文件筛选、简单备份、偶尔的磁盘碎片整理等基本工作即可;但是现在,随着耗资几十万美元的SAN的出现、不断进行的服务器整合,以及受不断膨胀的网络对象数量驱动而越来越大的容量需求,存储再一次成了一个明显的网络成本的组成部分,再一次成为资源管理的重要对象。
存储资源管理概述
一个全面的存储资源管理方法首先要获得这些与网络或终端相连的合适的资源,以及使用这些资源的相关资料,然后要对其性能进行管理,对其运转进行实时控制,以确保其连续的可用性和可靠性。
存储资源管理中的主要任务可分为如下几种:
供应:怎样获得并为网络提供存储资源?
控制:怎样管理其内容、容量及使用资源的方式?
性能管理:怎样监视性能和可用性,并维持一个适当的标准?
保护:怎样使数据和文档更加安全以免损失?怎样随时间变化来维护它们以使成本更有效?
报告和成本确定:怎样向那些需要作出智能决策的用户、管理者和会计部门提供存储资源使用信息?怎样将使用与成本对应起来?
下面我们将对上述问题一一进行探讨,我们也将看到一些被实践证明了的好方法。
1. 供应
供应牵涉到硬件和软件两方面的问题。硬件方面,从一个整体策略来看,其中部分内容(包括网络设计和采购策略等)超出了本文讨论的范围,我们现在假定硬件已安装好并正处于运行中,在此基础上展开讨论。对于存储资源管理的供应方面,包括怎样合理安排物理资源并将其提供给用户群,即怎样对物理资源进行有效的逻辑安排。每个配备了PC的人都熟知需要在磁盘上创建分区或卷,然而,这种遗留系统中的卷有很大的局限性,受限于一组物理媒体的范围,也受限于固定的大小,如果想对这些限制进行改变,就不得不关闭系统。RAID(独立冗余磁盘阵列)技术虽然对于容错和性能改善有一定作用,但对于突破这些限制也是无能为力。但更先进的技术使我们可以选择采用实时虚拟化的方法(比如Windows 2000中的动态磁盘),这是一种真正的卷管理技术,使我们可以跨越多组物理媒体创建虚拟驱动器,这样就可以在必要时重新划分大小或重新配置。
与存储资源管理相关的供应策略就是怎样将物理资源组织为适当的逻辑资源,以及怎样将这些逻辑资源合理提供给用户群使用。
2. 控制资源
当我们已经建立了一个或多个共享存储池后供用户使用后,接下去要做的就是制定策略以便对这些资源的控制和使用进行维护。没有一个好的控制方法,我们就不能保证服务质量,也不能保证不同用户无干扰的进行工作。
进行控制意味着我们必须对用户或对象消耗的空间数量设定限额,同时还要对能放入其中的内容就行管理(文件筛选)。没有限额管理,一个粗心的用户、一个失控的进程或一个黑客的恶意攻击就将消耗掉所有的可用空间,使其他用户不能得到存储资源。另外,存储限制还可以使用户养成良好的使用习惯,人们会考虑到限额的问题而谨慎使用资源,避免造成浪费,同时省去了清除垃圾文件的烦琐。
如果没有文件筛选管理,那么就算细心的用户也难免会将重要文档或工作成果存放到无保护的区域(比如没有备份的桌面硬盘驱动器),另外,无聊的用户也会下载多媒体文件等导致公共资源的浪费,甚至还有可能下载一些受版权保护的资料并存储到网络中从而给公司带来危险。
控制的目的并不是拒绝服务,而是为了对所有人都提供一个可预期的服务质量保障,并且尽量将麻烦排除在外。
3. 性能监视和管理
在建立了存储资源并以可控的方式提供给用户群之后,我们必须对其可用性和性能进行维护,如果某种资源的性能不可预期的话,怎么能说它好用呢?
这个问题包括两部分。首先我们要设定一个性能标准,并且用一个恰当的机制来检验其服务是否达到了目标,然后我们还需要恢复机制以便当情况变糟时能够及时恢复到原先的服务质量。只有管理最好的公司才有合适的存储性能评估标准和测量工具,更常见的情形是:用户为所欲为,这将必然导致浪费。不进行维护的话,存储性能迟早必将恶化。
大多数人现在都熟知“磁盘碎片”的概念了,没有什么文件系统对此是免疫的。严重的磁盘碎片会降低40%以上的文件系统性能,其它问题(太满、太多文件)也会导致类似结果,这是一个基本的排队理论问题,没有什么算法可以解决。就算在一个只有几十个用户的环境中,一个性能方面的小小恶化就会造成巨大的成本开销。例如,如果有60个用户,其一年的平均工资是44000元,他们每天由于网络反应速度问题不得不多等10分钟,则一年下来就将给公司造成55000元的生产力损失——大约是每个用户每年1000元。在极端情况下,从用户角度来看,如果存储子系统不能尽快的作出反应,用户会以为死机了,然后对帮助系统的调用将耗费更多的成本。显然,如果我们要为用户群提供资源的话,我们不仅要保证其能用,而且还应保证其好用。
4. 数据保护和保持
作为最常见的一种功能,每个人都知道文件系统有备份需求,因此没有任何网络是不需要备份技术的。备份的主要问题在于如何经济地进行管理。尽管一个磁带也许只值90美元,但每年用于维护一个磁带数据的开支却可能达到3500美元左右。存储管理中,不论是在线还是离线的,都不是免费的,我们必须确定所备份的都是有必要的,除此之外都不作备份,另外也可以采用层次存储管理(HSM)来降低成本。
5. 报告和成本确定
最后,当我们构造了一个条理清晰的、管理完善的存储资源后,我们还应能将对运行情况随时进行了解,以向用户、管理者和财务部门作出汇报,其中需要了解谁在使用数据、谁在驱动着额外的容量需求,需要得到计划和性能数据,还要具备预见和预测容量变化的能力。要达到这个目标需要有一个灵活的报告基础设施,使我们能将信息从环境中收集起来,并以易读的格式提交出来,并能以适当的方式提供给公司其它系统使用。简而言之,这意味着需要对报表技术和数据库进行集成。
解决方案综述
近些年来基于服务器的存储管理技术已取得了显著进步,策略性的管理系统不断出现,并能解决存储资源管理的各方面问题。尽管不同的机构都需要对存储资源管理技术的投资水平作出各自的决策,但这类技术和工具对于每个企业来说都是必需的,这将使他们受益,其中的主要问题在于如何平衡成本、风险和性能之间的关系。让我们先对这些选择作一个初步了解:
基本管理
限额和文件管理、性能监视和管理以及备份是任何Windows系统存储资源管理的核心所在,如果不能控制资源、维护性能、保护数据,那么其他任何事都不可能做好。对于某些组织来说,这些功能也许已经足够了,可以简单的话,就不要把事情弄得更复杂。如果存储资源总值不大,文档存储也并不是组织中的一个关键资源,那么基本的保护投资应该就是能兼顾到成本和效益的恰当的存储管理策略。
先进管理
随着存储资源的价值或重要性不断增加,相应的管理也要求越来越精细。在大型组织中,很多事物都处于动态变化中,随着事物数量的增加以及变化的不断加快,成本也将扶摇直上,大公司每年变换工作的人数平均约为20%到25%左右,如果没有适当的工具和策略,存储资源管理将会消耗大量的时间和金钱。
先进管理策略首先包含基本管理的所有内容,在此基础上还包括以下功能:
对存储系统目录数据和帐目数据图表的综合报告,以便自动进行成本确定和逻辑容量规划
将限额与工作流系统进行整合,以自动限制增长
设定策略自动进行文件删除和存档
整合自动监视技术,以便根据条件的变化自动重配置存储访问路径和服务器
自维护系统
只要有适当的存储资源管理技术,存储系统就几乎可以进行完全的自维护。
限额设定可用于触发文件的自动删除和自动供应额外资源,还可以与桌面帮助系统、企业内网工作流应用程序等整合起来,以便为用户提供行动指南,并自动处理限额增长;可以对性能管理系统进行整合以便能自动重配置和平衡分享存储;可以扩展限额和成本确定系统,将二级的、近线的、离线的媒体中所使用的空间也包含进来,成本的划分准确无误。