Chinaunix首页 | 论坛 | 博客
  • 博客访问: 809534
  • 博文数量: 850
  • 博客积分: 10010
  • 博客等级: 上将
  • 技术积分: 9960
  • 用 户 组: 普通用户
  • 注册时间: 2008-07-04 11:03
文章分类

全部博文(850)

文章存档

2011年(1)

2008年(849)

我的朋友

分类: 服务器与存储

2008-07-08 16:17:07

这是一个越来越复杂的世界,信息数据支撑着社会的发展,我们希望穷尽所能将一切资源充分利用,也希望能够用最简单的方式化解难题,更希望轻松地掌控难以管理的数据。虚拟存储技术的出现真的能破解这些问题吗?

  英国电信会议公司是一家专为企业提供包括电话、视频和电子会议在内的解决方案及服务供应商。几年前,英国电信会议公司碰到一个棘手问题:一遇到大量用户在周末马拉松式例会,系统就会关闭。其技术负责人说:“关闭系统主要是为了平衡资源,我们必须把载有会议数据资源的磁盘从一个磁盘阵列转移到另一个磁盘阵列上。”

  他解释说:“当时,我们采用的是DAS(直接附加存储)存储系统方式,它是一种把存储数据的磁盘阵列直接连在服务器上的传统方式。在数据处理过程中,涉及大量的性能调制、应用程序升级和数据移植等,也牵扯很多复杂而耗时的操作,因此,管理员需要花费很多业余时间转移磁盘和数据,而公司也要为此支付额外开支。最不幸的是,受这种存储架构的影响,我们被业务上的竞争对手远远地抛在后面。”

  后来,英国电信会议公司决定选择一个全新的存储战略,重点在于系统的灵活性和可用性。

  技术负责人回忆着:“我们最初准备考虑存储区域网络 (SAN),但很快发现,虽然SAN 可以解决大多数问题,却不能满足我们迅速调整存储资源、响应商业随机变化的需要。”

  英国电信会议公司希望有一种集成的存储管理方式,使他们的存储可以用于任何目的、任何时间。

  经专业人士的深入调查,“我们被建议引入SAN虚拟存储技术。”技术负责人坦言。“当时,对于虚拟存储这一概念,我们闻所未闻,搞不清楚它到底是个什么技术,更不明白我们为什么要用这个技术。”

  虚拟存储从何而来?

  由于存储已成为IT系统中一个完全独立的子系统,正面临着越来越复杂的管理问题。比如,原有设备和新增设备往往属于不同产品系列,甚至来自不同的供应商,遇到像英国电信会议公司这样数据分散的用户,当要同时调用不同产品系统的资源时,会面临复杂的管理挑战。

  尽管如此,管理人员还是需要尽力分析每个设备的使用情况,包括每个设备的性能瓶颈以及空间使用率等等。这种复杂繁琐的管理机制不仅不利于存储系统的工作效率,更是企业IT系统稳定性的一大隐患。虚拟存储就是在这种情况下产生的。

  藏起“复杂”

  它把存储环境的复杂性隐藏起来,把可存储数据的空间充分利用起来,让越来越难以管理的数据轻松管理起来的存储技术。

  也就是说,虚拟存储将互相独立、不同品牌的磁盘阵列组合成一个单一的逻辑存储资源池,向服务器层(可视为向用户)屏蔽存储设备硬件的特殊性,而只保留其统一的逻辑特性(可视为是单一品牌的存储设备)。

  数据可以在不同层次和类型的存储系统之间自由移动(具体取决于业务需求),为用户所用,又不影响运行环境。从而实现了存储系统集中、统一而又方便的管理。

  就像来自不同河流、含着不同乡土气息的水流入巨大无比的蓄水池,来自不同乡土的用户可根据个人喜好,从池子中舀出不同地区的水饮用。他们不用关心所需要饮用的水在池子的什么位置存放,也不用关心混在一起的各地的水怎么存放,更不用担心蓄水池能否盛下这些水,是否有剩余空间没被放满水。

  “包装”设备

  从存储设备使用上,虚拟存储的另外一层含义是设备使用方式的转化,这应该更接近“虚拟”这个词的本意。

  所谓“虚拟”就是假的,模拟的,而不是真实的,是在设备的使用形式上做了手脚的。

  比如将磁带当作磁盘使用,将磁盘当作磁带使用;或者将TCP/IP的网络连接虚拟成SCSI连接……如此种种的虚拟技术,其目的除了方便上层服务器简单统一的使用之外,还在于扩展现有设备和技术的应用范围和领域。

  看得见的应用价值

  了解了虚拟存储,我们来看看它能给像英国电信会议公司这样的用户带来什么样的应用价值。

  价值一:存储管理的自动化与智能化

  由于企业数据越来越多,存储系统结构越来越复杂,当增加新的存储设备时,整个系统(包括网络中的诸多用户设备)都需要重新进行烦琐的配置工作。

  重新配置需要关机、重启系统、重新初始化等,势必会影响用户业务的正常运行,甚至导致用户数据不可用。

  在虚拟存储环境下,所有的存储资源在逻辑上被映射为一个整体,对用户来说是单一视图的透明存储,而单个存储设备的容量、速度等物理特性却被屏蔽掉了。

  从技术角度讲,无论后台的物理存储产品是什么设备,服务器及其应用系统看到的都是用户存储设备的逻辑映像。系统管理员不必关心自己的后台存储,只须专注于管理存储空间本身;所有的存储管理操作,如系统升级、改变RAID级别、初始化逻辑卷、建立和分配虚拟磁盘、存储空间扩容等,都变得轻松无比。

  价值二:提高存储效率和利用率

  当前困扰企业用户的最大问题是物理存储设备使用效率低下。

  以传统磁盘存储为例,考虑到用户数据的不断增长,实际上平均40%~50%的磁盘容量从未被利用过。但为了满足系统性能和以后升级扩容等方面的要求,用户一般会购买超过实际数据量需求3~4倍的磁盘空间,用于磁盘镜像等附加功能,从而造成对存储资源的极大浪费。

  虚拟存储技术解决了这种存储空间使用上的浪费,它把系统中各个分散的存储空间整合起来,形成一个连续编址的逻辑存储空间,突破了单个物理磁盘的容量限制,让用户几乎可以100%地使用磁盘容量。

  价值三:减少TCO、增加ROI

  由于历史原因,许多企业不得不面对各种异构环境,包括不同操作平台的服务器和不同厂商不同型号的存储设备。虚拟存储可以支持物理磁盘空间动态地扩展,这样用户不必抛弃现有的设备,就可以将新的物理磁盘空间融入到系统中,保护用户已有的投资,降低用户TCO,增加ROI

在哪儿“虚” 和怎么“虚”

  目前,市面上已经涌出很多虚拟存储方案,但要理解这些虚拟存储方案,并确定哪个方案适合自己,这并不容易。

  英国电信会议公司决定采用虚拟存储技术解决马拉松式周末例会问题后,在选择何种方案时又遇到了新课题。

  其实,攻克这个课题也不难,英国电信会议公司必须要先搞清楚一个技术问题:虚拟是在什么位置完成的,又是怎样进行虚拟的?

  寻找“虚拟”的种种答案

  在典型的网络存储结构中,包含了前端主机、后端存储设备以及连接前后端的存储网络。在这样的结构中,实现虚拟存储的位置只可能有三个:服务器、存储设备和存储网络。

  根据处理数据的位置,并按照SNIA定义的共享存储模型,虚拟存储可分别在主机层、网络层和控制器层三种级别上实现。因此,虚拟存储就被分为“基于主机端的虚拟存储”、“基于存储设备的虚拟存储”以及“基于存储网络的虚拟存储”三种类型(如图1所示)。

  “虚”在服务器上

  基于服务器的虚拟化是以软件模块的形式嵌入到应用服务器的操作系统中来实现虚拟的。软件的作用是向系统输出一个单独的虚拟存储设备(或者可以说一个虚拟存储池)。其实,这个虚拟的存储设备后台有若干个独立的存储设备组成,只不过在系统看来,它们是一个有机的整体而已。

  通过这种模式,用户不需要直接去控制管理这些独立的物理存储设备。当存储空间不够的时候,管理软件会从空闲的磁盘空间中映像更多的空间输出给系统,而在系统看来,它所使用的虚拟存储设备的空间在动态地增加,并没有影响到它的使用。

  “虚”在设备上

  基于存储设备的虚拟化是指将虚拟的功能放在存储设备的适配器或控制器上。比如说虚拟磁盘阵列就是通过磁盘阵列内部的控制系统进行虚拟的,同时也可以在多个磁盘阵列间构建一个存储池。

  这种基于存储设备或存储子系统的虚拟,通过特定的算法或者映射表,把逻辑存储单元映射到物理设备之上,最终实现卷独立于其所属的存储设备。

  HDS TagmaStore通用存储平台(Universal Storage Platform,USP)就是一款有代表性的基于设备的虚拟存储方案。

  TagmaStore USP不仅具有332TB的内部存储容量,还具有外接并管理32PB异构存储设备的虚拟化能力。利用此能力,用户可以把内部存储与多个外部存储系统整合为一个单一的存储池,由日立HiCommand多层存储管理软件通过既定策略,在不同的存储层间透明地在线迁移数据,而主机无须知道数据具体存放在哪里。

  作为TagmaStore USP的一个延伸版,企业入门级方案NSC55具有与V相同的微码以及所有相同的软件和虚拟化功能。NSC55可无缝地管理高达16PB的内外部异构存储,包括EMC、IBM、日立数据、HP、Sun等公司提供的最新高端存储系统和中型存储系统。

  5月23日,在网络存储世界/2006中国大会上,HDS宣称推出NSC革新型NSC55 Diskless方案(也可以理解为存储控制平台),此时,它已摇身成纯粹的虚拟控制器,不再带内部存储磁盘,并专注虚拟存储。这样,用户无须额外购买不必要的磁盘,只需以购买控制器平台和软件的价格,就可获得全方位的存储服务。

  据了解,NSC55 Diskless的处理器可从8个扩展到32个,FC主机端口可以从16个扩展到48个,系统缓存可从4GB扩展到64GB,控制缓存最多为6GB。可见,其拥有一些高端性能,而定价只相当于中端存储系统水平。

  “虚”在网络上

  所谓网络指的是存储局域网络(SAN)。具体到虚拟功能的实现,可以在交换机、路由器、存储服务器进行,同时也支持带内(In-band)或者带外(Out-of-band)的虚拟。

  带外虚拟化和带内虚拟化需要使用相应的专用虚拟化引擎来实现。虚拟化引擎是一种被称作SAN Appliance的专用存储管理服务器,它可将多个物理磁盘系统组合成大的存储空间或者把它们分割成小的存储单元,并根据主机对容量、速度和可用性的要求,将这些存储单元分配给主机使用。

  虚拟化引擎可以两种形式来控制存储的虚拟化:直接位于主机服务器和存储设备的数据通道中间(带内);或是位于数据通道之外(带外,即将数据路径和控制路径分开),仅仅向主机服务器传送一些控制信息,来完成物理设备和逻辑卷之间的地址映射。

  目前,基于交换机或路由器的虚拟技术还属于起步阶段,其优势是不需要在服务器上安装任何代理软件,交换设备潜在的处理能力可能会比传统的虚拟存储模式提供更强的性能。另一个优势体现在安全性上,该层次比前面的虚拟应用对外来的攻击拥有更强的防护能力。其劣势主要表现在单个交换机和路由器容易成为整个系统的瓶颈和故障点。

  带内虚拟功臣:IBM SVC

  该解决方案分SVC(IBM Total Storage SAN卷控制器——SAN Volume Controler)和SVC内置MDS交换机两种结构。所有虚拟化数据都要通过SVC进行处理。SVC本身可以作为一个单独的产品使用,也可以将所提供的SAN卷控制器软件嵌入到Cisco MDS 9000光纤通道控制器和交换机的高速缓存服务模块之中,提供内置在智能交换机上的虚拟存储功能。

  因为完成存储层的虚拟化,SVC可为各种不同的存储设备提供统一的数据复制平台,例如瞬间复制Flash Copy和远程复制Metro Mirror。这些复制功能都允许源磁盘卷和目标磁盘卷可以存在于不同品牌的磁盘阵列上。

  据悉,SVC支持当前所有主流的存储系统,包括IBM、HP、EMC、HITACH、SUN等。需要指出的是,智能交换机的数据安全功能是由智能交换机本身提供,与存储无关。

  全球存储系统事业部销售副总裁Elly Keinan说,“在传统的开放系统环境下,磁盘之间的利用率达到40%左右,使用SVC以后基本上可以提高到60%左右。”

  他还说,在过去,如果把数据和应用从一个磁盘切换到另外一个磁盘上需要中断业务应用,采用SVC后,可以不间断地把数据从一个磁盘转到另一个磁盘上。

  带外虚拟功臣:EMC Invista

  说到此,不能不提及EMC的Invista。

  EMC Invista是利用智能交换机的特定处理能力,实现核心层的虚拟存储操作。

  在存储设备虚拟化的过程中,EMC Invista可让用户保留存储设备原有的性能和软件功能,允许用户选择对其异构存储环境进行虚拟化,也允许用户继续使用当前仍在其存储系统中运行的基于阵列的复制功能或其他存储软件功能。

  通过在多个异构存储设备间建立虚拟卷,EMC Invista网络存储虚拟解决方案使企业IT部门大幅度地减少花费在人工作业上的时间。

 选择?着实不易

  基于主机方案、基于存储设备方案和基于存储网络方案……英国电信会议公司到底该选择哪一个?

  此时,英国电信会议公司思考着三个问题:

  一些供应商把虚拟化功能添加到存储阵列控制器上(往往称为基于阵列的虚拟化),这意味着存储设备和虚拟化功能需一同买来;

  另一些供应商把虚拟化功能添加到位于应用服务器和存储系统之间的服务器上(往往称为基于设备的虚拟化),这可能消耗系统资源;

  还有些供应商把虚拟化功能添加到智能交换机上(称为基于网络的虚拟化)。智能交换机或者采用“带内”方案,即虚拟化命令与数据沿同一条通道在应用服务器和存储阵列之间传输;或者采用“带外”方案,即虚拟化命令和数据在不同通道上进行传输,这可能限制了灵活性。

  事实上,没有哪种虚拟化方案是“最佳”选择,这完全取决于用户的目标。用户一定要考虑好虚拟存储可为自己提供哪些种类的操作,哪些对自己最为重要。

  每个用户采用虚拟存储的目标都是不一样的:有些人希望放慢硬件支出进度;有些人希望减少管理预算; 有些人也许希望重新设计整个存储基础设施的架构;另一些人则希望逐步实施分层存储。

  例一:倾向重新设计存储基础架构

  英国电信会议公司希望重新设计整个存储基础设施的架构,经过对三种虚拟存储模式的考量,它最后选择了基于网络的虚拟存储方式,并相中了IBM SVC来实现数据存储及管理的设想。

  英国电信会议公司首先需要将死板地安装磁盘的管理方式转换为灵活地调整虚拟存储容量的管理方式;其次,它应该把存储配置转换成随需应变模式,以支持它在全球的会议服务。

  考虑到IBM SVC的架构式设计,以及与IBM FlashCopy PointinTime复制软件的有机结合,英国电信会议公司最终选择了IBM SVC。

  “先前要花费6~8个小时的数据转移过程,现在只需几分钟;先前要花费整个周末来完成的事情,现在可以在工作日完成。我们再也不用关闭服务器和打开磁盘阵列的方式来移动磁盘驱动器,所有工作现在可以通过网络控制台来重新分派磁盘容量。”存储系统改造之后,技术负责人满意地说。“同时,Linux和pSeries服务器也不需要关闭来重新定制磁盘改装。只需在 SVC上设置新容量即可。”

  今天,英国电信会议公司的应用程序的确达到了全天候可用的水平。

  例二:青睐分层存储

  犹他州立大学医疗保健科学中心 (UUHSC)由社会临床、犹他大学医学院、学术学院和各种研究所等几部分组成。近五年间,数据量由1TB增长到47TB。

  此外,其数据资源中心管理着由不同供应商的存储产品所组成的多个SAN。而且,系统中还有大量闲置、未被利用的存储容量。

  UUHSC数据资源中心的技术建筑师及总监 Jim Livingston说:“低效的信息管理必然带来瓶颈,严重限制了数据可用性。我们需要24×7不间断运营,因为成功获取信息能够帮助我们拯救生命。”

  虚拟存储被认为可以解决UUHSC数据增长与管理的问题。但是,UUHSC在评估了三种虚拟存储实现方式之后,特别是评估了基于网络的虚拟存储解决方案后,发现管理另一个网络的风险、人员与培训量的增长,以及将会带入系统的单点故障,让他们放弃对此类方案考虑。

  最后,UUHSC选择了基于控制器的虚拟存储方案。它看上了HDS TagmaStore USP,因为USP可以让UUHSC实施一个新的分层存储架构。

  UUHSC选择的HDS解决方案包括以下产品:HDS TagmaStore USP100;McDATA 边缘交换机和核心导向器;作为外部连接存储的HDS Thunder 9585V 超高端模块化存储系统和Thunder 9520V工作组模块化存储系统。

  原先在HDS 7700E和HDS Thunder 9200系统上访问数据的应用现在都被连接到USP100上,并通过一个单一的管理界面来进行管理。新的系统架构能够对分布在内部存储USP、外部光纤存储和SATA存储上的数据按其应用需求进行分层式存储。UUHSC的一个为关键应用提供软件的供应商要求将应用数据存放在IBM ESS 2105系统上(如图2所示)。

  在此次整合的最后阶段,有一项工作是把ESS2105作为外部存储连接到USP上,这样既满足了软件厂商的要求,也使UUHSC能够将ESS2105作为一个单个逻辑实体、并通过一套管理工具对整个系统进行统一管理。

  此外,UUHSC还决定采用四台McDATA Sphereon光纤交换机和两台McDATA Intrepid 6000系列导向器来替代原有的SAN 光纤,由此简化了电缆切换,方便了未来对系统进行扩展。

  以上是两个以目标为导向的选择虚拟存储实现模式的例子。

  实际上,无论什么目标,对于用户来说,都有一致共识,就是:供应商必须在集成异构系统、简化部署方面做得更好。

阅读(277) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~