存储到底有多智能?这个问题的答案取决于到底是谁提出的疑问,和怎么定义智能。存储的智能化,一般认为,是指硬件、软件、文件和存储容量管理的高度灵活性和自动化。但是存储智能化究竟是什么,在各个厂商之间还是有一些争论。目前,各个厂商一般都偏爱他们自己的,或者是其合作伙伴的存储智能化方案来完成日常存储任务,尽管这些任务中的多数其实不一定必须通过智能化方案来完成。比如说,思科公司声称计划在企业级存储网络广泛添加智能化,各个存储领域的公司都一定程度上赞同思科公司的想法,但是Brocade和Incipient比较倾向于在SAN交换器上面执行智能化操作,而EMC则认为智能化应该由连接到SAN交换器的特定应用程序来完成,而磁盘阵列厂商,比如日立数据系统则倾向于将智能化功能添加到磁盘控制器当中。不过,不管是不是心甘情愿,几乎所有的厂商都同意智能化可以在以上各个层面共同执行。
EMC的产品市场经理Kevin Gray表示“存储环境下的每个存储部件,在某些特定功能上都有着一些特定优势,而我们要做的是充分发挥每个存储厂商的每个部件的优势。”比如说,磁盘阵列在高可用数据存储和缓存管理上有着优势,而交换器则在I/O管理上有着优势。
事实上,争论不仅仅局限于智能化应该被添加到存储网络的哪个组件。即便相当成熟的存储智能化——虚拟化——用户和厂商也有着不同的争论——怎样的虚拟方式更加有利——究竟选择块数据虚拟方式,还是文件虚拟方式。IDC存储分析师Richard Villars指出“比较不同的存储虚拟化技术十分困难,我们还需要时间评估这些技术的具体部署情况。”
文件的虚拟化
文件虚拟化,或者更广泛的称为文件区域网络File Area Network(FAN),可以将文件系统集中在一个数据中心,被集中的这些文件可以被集中管理,也可以被方便的转移。存储网络工业协会(Storage Networking Industry Association SNIA)的成员Rick Gillett,他同时也是 Acopia Networks公司的CTO,曾经表示 “ FAN是一种提升非结构化数据管理水平的系统,它让数据或者服务器和NAS文件管理器脱离关系,提供了一些比如数据迁移,均衡负载和复制等服务。”
IDC分析师Villars表示,文件虚拟解决方案满足了三种商业需求:
1:合并分散的企业信息到一个简单的NAS系统。
2:有效的使用这些商业信息。
3:减少费用。
Villars在2007年早些时候对一些公司进行了虚拟化调查。调查的结果显示,虚拟化使这些公司减少了存储费用的50%~80%,而管理效率则提升了90%。
文件虚拟化技术对于拥有5台以上服务器或NAS文件管理器的管理员非常有意义。目前,在多数公司里,每一台服务器或存储设备都有自己的一套文件系统。这使得管理和移动这些数据非常麻烦。而如果IT管理员添加了一台服务器或者NAS文件管理器,他需要重新安装系统,并且需要单独维护。这样就很可能发生一种情况:一台服务器有过高的负载,而其他服务器资源则处于闲置状态。而且在这种情况下,部署完整的文件系统容灾方案,将消耗大量宝贵的IT管理员时间资源。
举一个例子,Harold Russell,USDA公司的 FOOD & Nutrition Services(FNS)的项目经理,描述了他最近在做的一个项目,在这个项目当中,Russell是承包商,发包的公司是Wyandotte NetTel。Russell表示,在这个项目的执行过程中,USDA公司必须将数据从对方的DAS中提取,再传到自己的NetApp文件管理器之中,这也意味着,IT人员必须亲自的到每一台相关的存储设备操作,以保证整个传输过程不出差错。如果顺利的话,这个过程可能将耗费数天才能够最终完成。
不过Russell很快变成了一个FAN支持者,FAN需要添加一个称作Global Namespace 命名空间的逻辑层,命名空间在服务器管理、文件重组和聚合时,会使管理员感觉,这样的操作,和在同一台机器上操作没什么两样。当然,这些被执行操作的文件很可能存在于不同的设备,但是在管理员操作时,看到的却是相同的树状结构,在结构中可以清楚地看到不同文件存放的不同位置。
Russell使用NetApp的虚拟文件管理软件Virtual File Manager(VFM),在很多不同的服务器和NAS设备上将文件虚拟化。这个解决方案包括了文件虚拟化、复制、容灾备份、失效备援、和迁移。USDA公司的FNS项目分为八个区域,现在每个区域都分配了带有VFM软件的设备:在每个区域,都部署了两台NetApp FAS250文件控制器,作为主要存储设备。还有两台FAS 270s作次级存储设备。这样的部署之下,IT管理员可以在FNS项目执行时使用VFM SnapMirror软件,来复制数据到次级存储设备,以供容灾使用。另外,每个区域同时有5个文件服务器,这些服务器是HP的ProLiant DL 380和ML370服务器。在以往,文件管理在FNS中不是连续的,而且容灾和实效备援也造成了最终用户的疑惑和延迟,因为他们很可能不知道该在哪里找到文件。
“这个时候,VFM global namespace命名空间就派上用场了。它简化了文件结构和移动文件的管理工作,”Russell表示“现在我们可以传输文件到任何一个使用命名空间的硬件。除非遇到了紧急状况,比如失效备援failover,这时文件服务器需要大概1~2小时宕机,而主要的文件管理器只需要20~40分钟宕机时间就可以恢复工作。
当然并非只有NetApp支持FAN,比如Wiley 出版公司使用就是Acopia FAN来处理为数众多的文件存储。在Wiley公司,每年有大约25TB的新增文件,被加入到Windows服务器环境下。Wiley的IT架构师James Sample透露,备份可能需要36小时。目前在Wiley使用Acopia公司的文件虚拟设备,按照法律法规,将没有变化的文件移动到一个不同的存储层级上来。大约90%的文件在一个月之后不会有什么变化,这些文件就被转移到了低一些的存储层级上来。因为这些低层级的文件已经备份,所以也就无需再次备份。如果低一些层级上的文件有所变化,文件则将被移动回高一些的存储层级进行备份。其间,驱动器的映射一直保持原状,尽管实际其中有很多变化,但是最终用户不会感觉有什么不同。
尽管架构师James Sample的报告表明了新的存储架构智能化更新可以迅速被部署,但是这其中还是有一个问题存在,这个问题可能源于Wiley IT架构的独特性。架构师James表示,许多厂商都只倾向提供补丁式的方案给系统,而并不是改进整个流程。目前Wiley公司正在计划增加第三个存储层级,而且计划扩展文件虚拟化到备份和容灾上。“如果我们备份的宕机时间从36小时缩减到1小时,那么意味着每周节省2000美金,”James这样评估“我们也有报告和反馈的能力,可以看到用户何时存取文件,这样我们可以在删除或者保存文档的问题上,做更好的决策。”
块数据虚拟化
尽管有很多应用支持文件虚拟,但是也有一些人认为块数据虚拟比起文件虚拟FAN提供了更好的智能存储基础。3PARdata公司 的CTO Ashok Singhal认为“尽管虚拟化可以运行在很多层级上,但是最底层应当是虚拟化最应该被部署的地方。”Ashok Singhal同时也建议虚拟化应当部署在块数据存储层级。不同的研究都表明50%~90%的存储虚拟化在底层,而只有10%~20%在高一些的层级。
Gartner的分析师Robert Passmore曾经这么分析存储虚拟“找到一个合适的虚拟化层级非常重要,随意在多处部署虚拟化是非常不利的。因为存储虚拟化意味着添加一些软件层级,或者添加一些硬件,而随意的虚拟化部署会增加很多费用,而且存储结构也变得复杂,最终可能并没有达到简化系统的目的。”
对于3PARdata公司而言,虚拟化被部署在了磁盘阵列上,使得管理员可以在应用运行的时候,改变RAID模式。这种动态优化的特性,使存储服务的水平上了一个台阶。
一个3PARdata公司的客户,Banc of America证券公司。这家公司的数据中心数量众多,而且各自为政,没有充分的数据共享,这些因素都导致了该证券公司数据中心的效率低下。事实上,相对于这家证券公司的实际需求,它所拥有的总存储能力非常充裕,但是在这样的存储背景之下,整个系统非常难于管理,而且也不容易扩展。公司数据中心的这些弊端,最终促使公司决心部署3PAR磁盘阵列和IBM刀片服务器所构成的虚拟化的SAN。同时,这家公司也将众多的数据中心整合成了两个数据中心。
Banc of America证券的技术副总裁Gary Berger这么评估“虚拟化和数据中心整合削减了95%的存储管理费用。而且,我们可以给每个应用和业务部门分配虚拟资源,每个部门和应用也都可以和以往一样正常操作,看不出什么差异。”事实上,虚拟化可以将各个存储资源抽象出来,并且聚合到一个大的虚拟资源池,在资源池当中,所有的资源都可以被更加轻松的管理。但是这个虚拟化就是真正的存储智能化吗?
瘦配置和加密
大多数存储业内人士都倾向于认为虚拟化就等于智能化。但是也有一些人认为,某些存储的功能特性,比起虚拟化,更称得上是存储智能化。Banc of America的技术副总裁Berger,他很强调3PAR的一种能力——将磁盘切割成一个一个的256MB的“块状物”,以便改善负载均衡,进而提升I/O性能。而其他的磁盘阵列,缓存耗尽时,整个系统的性能将急速下滑。另外3PAR阵列提供了更好的灾难恢复,这个灾难恢复基于廉价的跨数据中心备份(cross-replication)。
另外一个经常被提到的智能存储的特点,是thin provisioning 瘦配置,(目前国内对thin provisioning没有统一的翻译,也有称之为空间超额分配、资源随需配置、存储资源前瞻规划等等,本文中,我们称之为瘦配置)。整个存储系统近年都在迅猛增加,通常情况,一个存储管理员必须分配一些磁盘,给某些特定的用途或业务部门。为了防止某些用途或者业务部门的磁盘资源不够用,管理员通常倾向于分配给每个部门远超过其需求数量的磁盘。而这个过程同时也浪费了大量宝贵的管理员时间。而瘦配置则意味着提供给各种应用或部门一个虚拟化的空间,一般而言这些虚拟空间的容量可以超过实际的物理空间,而当管理员最终统计所有这些虚拟空间的效能时通常会发现,存储瘦配置是一个非常好的方案。
Milford集团的分析师Tony Asaro描述了一个真实的案例。一个公司分配了2TB的空间给一些用户,但是只有300GB被使用。虽然被使用的空间仅为15%,但是所有2TB的空间毕竟还是被分配出去了,这样IT管理员就需要增加更多的存储能力来满足下一步的存储部署。或者,管理员只能重新人工重新配置整个存储环境。而瘦配置(Thin Provisioning)则意味着,2TB即便被分配出去了,但其中剩下的1.7TB可以被其他用户方便的使用。
Asaro表示“这种瘦配置Thin Provisioning很大程度上简化了存储,而且保证用户利用存储空间备份的是真实数据,而不是浪费存储空间。这种简化的能力降低了数据中心的电力和制冷需求。当然,不仅仅是电力和制冷,瘦部署对于我们的磁盘本身的成本也有着不小的削减。我们大约缩减了购买磁盘数量的50%。而且瘦配置也简化了存储配置过程,最重要的是,瘦配置避免了由于磁盘空间分配不合理而导致的重新配置。”
除了瘦配置,加密技术同时也是人们讨论存储智能化时经常提到的概念。UC Davis医疗中心的存储主管,Alejandro Lopez最近部署了NetApp提供的Decru加密技术。整个存储系统的配置为:日立数据系统的TagmaStore Universal Storage Platform通用存储平台(USP )磁盘阵列和Brocade的交换器,不过这位存储主管并没有准备大规模部署数据加密技术,至少在交换器充分整合此项技术之前没有打算。但是Alejandro Lopez主管也表示,如果将来加密技术可以不那么占用资源,他也很乐意重新考虑这项技术。Lopez 也指出“由于Decru并没有与我们的底层结合在一起,所以也导致了众多的加密都在运行。而如果NetApp和Brocade可以将加密集成到交换器之中,我个人觉得那才是最好的系统加密解决方案。”
尽管这些技术都充实了存储智能化的概念,但是企业管理协会的Mike Karp认为存储智能化还远未到来。他认为真正的存储智能化目前还只是处在初期阶段。目前的分析都认为下一代存储智能化的发展还有很大的空间。
例如EMC Smart软件,对系统可能出现的问题做出了预测,Karp表示“Smart可能在将来非常有用,尤其是对于那些比较常见的存储问题,Smart都可以一定程度上帮助我们避免。但是,对于极少发生的问题,或突发的存储问题,Smart还是没有办法很好的预测。”
结论:迎来巨大的飞跃
文件虚拟的发展并没有错过智能化趋势。例如Attune系统公司,一直在研究符合政策法规的管理、动态卷扩展,和更广泛的信息生命周期(Information Lifecycle Management)管理部署。而Acopia则发布了0存储基础层级(0 Tier)。这是一个小的内存区域,用来保存最频繁被存取的文件。
Taneja集团的分析师Brad O'Neil表示,“FAN最终将会非常适应商业级别的文件管理和存储智能化趋势。而块数据则不太可能很好的适应FAN,而且文件存储网络并不支持应用级存储内容。
UC Davis 的Lopez也在其NAS设备下使用了Acopia的文件虚拟技术。不论虚拟化在哪个层级部署,他都有相同的建议:部署虚拟化应当缓慢而且自然,尽可能保持系统简单。复杂的系统,常常导致更为复杂的问题。
而Asaro的结论是,目前的存储大多只是部分虚拟,而且不涉及太多智能化的基础架构虚拟。但是他相信这种现状将会很快改变。存储不像服务器那样很早就充分的运用了虚拟化技术,事实上,存储是虚拟化盛宴的迟到者。不过依照目前的趋势,存储不久将会在虚拟化和智能化上有巨大的飞跃。
阅读(207) | 评论(0) | 转发(0) |