分类: 服务器与存储
2008-07-13 16:07:22
非结构化数据带来的难题
目前,SAN、NAS应用得较广泛的数据存储技术。然而,现在的非结构化数据越来越多,导致现在的存储系统在管理上越来越难了。
据F5亚太及日本数据解决方案副总裁Joseph Signorelli 分析:由于很多非结构化的数据爆炸性的、无管理的增长,文件虚拟化目前非常流行。这些数据不能放在数据库中进行管理,例如邮件、Word文件和音频视频文件等。并且企业也没有投资成百上千的美元去购置成百上千的NAS设备以及PB级别的磁盘存储来管理这些数据。
这些数据正以无法遏制的速度不断增长,企业只好花更多的人力去管理它们。而这些数据一开始就创建的乱七八糟,随处可见,这导致了当前的数据存储解决方案难以管理它们。
在这种情况下,Acopia(已经被F5 Network收购)等厂商提出了文件虚拟化解决方案。文件虚拟化技术能够隐藏所有你的物理设备,通过子物理设备上面构建一个新的层,本质上也就是为那些NAS设备提供一个对外的逻辑视图。所以你可以非常有效的管理你的NAS设备,让一切变得非常容易。
使用文件虚拟化的另一个原因是存储的需求继续不断的扩大,我们需要找到一个非常有效的方式帮助管理员来管理这些数据。并且更为关键的是,哪些数据能够管理?多少数据需要管理?这两者之间存在着很大的差异。而这种差异也将变得越来越大并产生更坏的结果。
理解存储虚拟化
虚拟化是当前讨论最多的技术之一,服务器虚拟化已经得到了很多企业的认同,如今,虚拟化已经进入存储领域。
但存储虚拟化是IT业的一个奇怪的现象。人们总是不停的提到它,但是准确的说,虚拟化到底是什么,它的真正功能是什么,还是有很多疑问。
根据调查公司Freeform Dynamics在英国最近所进行的一次定向企业的调查,对于服务器虚拟化,用户还是有很高的热情,而且清楚明白如何部署以及它所带来的变化。但是到了存储虚拟化,只有一半的报告回答者可以非常清楚或部分清楚存储虚拟化的概念。
有一种看法是:存储虚拟化指在现有的存储阵列上增加虚拟层的做法来实现。在现在的应用中,例如文件系统和存储阵列,其实就是虚拟化的例子。
其实,存储虚拟化最重要的一个分类概念在于:将数据文件管理系统与存储介质分离出来,从而实现数据的统一存储管理,这就是我们提到的文件虚拟化。
在这个市场上,主要存在两种主流的技术结构,一种是以Acopia为代表的采用以FPGA硬件处理的在线式结构,另外一种是以服务器+软件的旁路式结构,基本上除Acopia之外的所有产品都是服务器+软件的旁路结构。
文件虚拟化的关键:全局命名空间
在传统的网络文件传输或共享应用中,依靠的是文件服务器或NAS与客户端计算机之间,通过统一命名约定路径(UNC)来识别并确认存储路径,从而通过UNC提供的目录与路径即可让客户端计算机存储网络上的文件。
但在大型应用环境中,文件服务器、NAS与客户端计算机间的存储连接关系十分复杂,除了难以管理外,也不易改变连接结构或更新设备,一旦设备变动,将会同时牵涉到许多存储路径的修改。
因此一种解决方式就是舍弃过去的UNC路径存储法,在客户端计算机与NAS、文件服务器间插入一个虚拟层,让它来为客户端计算机与NAS建立连接。而NAS上的空间也不是通过实际的位置或名称,而是通过虚拟层的“全局命名空间(Global Name Space)”提供的虚拟位置来提供。
F5亚太及日本数据解决方案副总裁Joseph Signorelli解释到:“在全局命名空间的架构下可摆脱对UNC的依赖,所有文件存储资源都被虚拟层整合为统一的存储池,因此用户存储文件的“逻辑”名称或位置与“实际”名称或位置无关――用户发起的存储需求会被虚拟层导向到设定的位置,不用知道文件实际位置为何。这种关系可模拟为用户不用知道实际IP地址,只需通过DNS的转译就能自动连接到正确的Web一样。若某一存储路径失效,也能通过虚拟层自动转到另一存储路径上,因此文件存储服务的可靠性有所提高。”
由于不会受限于实际连接,管理者可轻易的在不同NAS或文件服务器间迁移数据,而无须担心前端使用者原来的存储会因此而受到影响,大幅降低数据迁移的难度,而且管理者还能制定政策,让虚拟层依据文件的属性或时间,自动将文件迁移到不同等级的存储设备上,实现数据归档或分级存储。
“其他的解决方案之所以不能持续的在线式运行,主要是由于性能受限于服务器的处理能力不足所致。采用旁路模式的主要缺点是需要在客户端(也就是使用NAS的服务器和客户端)上都需要安装专用的代理软件来进行管理”。Joseph Signorelli解释到:“而采用FPGA处理的Acopia在线式解决方案去除了很多旁路式管理的弊端,不需要安装客户端软件,不限制客户端的数量,在进行ILM(Information Life Cycle Management管理)的时候不在后端存储上生成文件Link。因此可以实现非常灵活的存储分配,并降低了管理维护的工作量和系统崩溃的风险”。
群雄共谋文件存储虚拟化
由上的分析可见,文件虚拟化系统可能给当前的存储系统带来革命性的变化,这是一个潜在的庞大的市场。因此,不少厂商介入了这个领域。
介入文件虚拟化领域的厂商主要分为两类:一类是原本为存储设备的供应商,例如博科等,另一类就是F5、思科等网络设备供应商。
基本上,这些大的厂商都是通过收购获得这种技术的,EMC 收购的Ranfinity,博科收购了NeoPath。
网络应用交付领域的领导者F5在2007年10正式收购了Acopia,从而进入了数据存储领域。Acopia是当前最著名的文件虚拟化企业之一。经过一段时间的整合,2008 年 2 月,整合后的文件虚拟化解决方案F5 Acopia FreedomFabric全面上市。由此,F5 Acopia 产品系列拓展了应用交付网络 (ADN),使之达到数据存储层的自动化管理,本次产品发布是 F5 公司坚持不懈贯彻实施该项战略过程中的又一项重大事件。
在这之前,思科也收购了另一家文件虚拟化厂商:NeoPath,以此进入文件虚拟化市场。存储设备厂商和网络设备厂商都看中了这个市场,由此可见,文件虚拟化市场的确是未来的发展趋势。
文件虚拟化:让文件存储管理与存储设备分离
不知现在你对存储虚拟化结构清楚了没有。
现在,我们再形象地解释一下:存储虚拟化方案主要包括两个部分,首先就是硬件存储介质,例如EMC等供应商提供磁盘机等,另一方面,就是文件管理系统,这是独立与存储介质的存储网络管理系统,通过与存储介质的分离,实现虚拟化的管理、数据的集中管理,并且带来兼容性、低成本等优势。
要知道,此前的文件管理系统往往与存储介质联合在一起,并且通常由某一个厂商提供,在这种情况下,就带来了兼容性、技术高成本、重复投资等多种问题,这也是当前存储系统价格居高不下的主要原因。
F5 Acopia FreedomFabric是存储领域内第一个用于文件虚拟化的独立管理软件平台。其在F5 专有的ARX硬件平台上运行,为在大型企业中跨多个分布式文件虚拟化系统进行管理的管理策略提供了基础,因而显著简化了部署和操作,减少了错误,并降低了运营成本。
在这个图中,我们可以看到:通过F5 Acopia FreedomFabric,将EMC、NetApp、Windows file storage等多种存储系统进行了统一的管理。这也是F5公司进一步完善ADN应用交付网络的重要战略之一。
Oversee Domain Services 公司的技术副总裁 Stephen R. O’Neill 先生介绍说:“一旦新品投入使用,显然我们会在整个数据中心环境中充分发挥 F5 Acopia 虚拟化功能。对于 Oversee 公司而言,F5 Acopia 解决方案不仅简化了数据管理,还帮助我们将预算控制在合理的范围内。有了这项新功能之后,我们将不必再像以前那样要管理单独的文件和单个快照。”
文件虚拟化之后的一个重要功能就是可以实现文件生命周期管理(Information Life Cycle Management,简称ILM)。所有的文件都是有生命周期的,当一个文件被创建的时候,属于价值最高的时候,文件的重要性随着文件未被修改的时间的推移而降低。例如,企业可以用最好的存储设备存放最新生成的文件,用低一些档次的存储设备存储3-9个月之间的文件,再用更为廉价的存储设备去存放9个月以上的文件。通过文件虚拟化技术,尽管这些文件分布在不同的NAS上,但他们可以对客户端呈现在同一个目录下。这样,可以有效的降低企业的存储资产投入,同时简化了系统管理和减小了备份窗口。
此外,文件虚拟化还有另外一个重要的特征:对数据进行热迁移。
如果能够使各公司能够将工作中的虚拟机从一个物理服务器移动到另一个物理服务器上,无需进行中断操作,这将极大地减少管理时间和成本,并保证了企业的关键应用的业务连续性。
你可以这样想像:一条生产彩电的生产线,断电并启动一次,需要至少半个小时的时间,而三峡水电站如果因为停止发电半小时间,这将带来多大的机会损失?
为了解决这个问题,F5 Acopia Freedom Fabric提供了数据热迁移功能,它提供了在异构(即采用多个不同供应商的环境)环境下,在不中断现有的生产环境运行的同时,进行后台的数据迁移,而这种迁移对于前台的客户端来说是完全透明的。在进行数据迁移的时候,管理员只需要在Acopia上开启一条处理策略,Acopia就可以开始自动进行文件的迁移工作,而与此同时,前台的客户端没有任何的中断,仍然可以按照平时一样进行文件的读写操作。
数据中心虚拟化战略
F5的数据中心虚拟化战略
逐步的,存储虚拟化将是当前企业架构数据中心的重要组成部分之一。在整合数据中心结构中,我们先要对服务器进行虚拟化,此后,再对网络设备进行应用交付的重构,最后,对数据存储进行虚拟化的管理,从而实现整体的数据中心虚拟化。
未来,数据中心在虚拟化技术的驱动下,将得到更容易、更安全、更低成本的管理。