尽管NAS本身不是
新技术,但下一代NAS技术刚刚上市。本文分析了典型的大规模NAS部署场景以及其相似和不同之处,还介绍了三种NAS架构以供用户选择。
因为不同的环境对NAS需求不同,企业面临存储问题时需对症下药。
如果IT管理人员在寻求坚固耐用、企业可扩展的存储系统来处理要求最苛刻的应用,现在他们有了新的选择: 网络附加存储(NAS)。尽管NAS本身不是新技术,但下一代NAS技术现在刚刚上市。NAS现在处于下一个发展阶段,它包括了适合行业使用的解决方案,并面向竭力简化存储和文件服务器管理的IT管理人员。
尽管许多人仍认为NAS是工作组文件共享技术,但如今越来越多的存储管理人员把NAS作为关键任务应用的优先存储基础设施来部署。各部门部署的NAS继续在增加,它们用于需要超高性能和存储容量的核心应用。这些应用包括企业级文件服务器合并、医疗成像、Web内容分发和计算机动画。
在企业环境,IT管理人员面临越来越多需要存储、保护及共享的海量数据。由于预算往往比较少,IT管理人员需要更有效,并且具有以下功能的技术:
● 为许多用户和服务器有效管理大量的数据文件。
● 动态适应不断变化的性能和容量需求,可实现零停机时间的扩展。
● 24/7/365的可用性及数据保护,包括即时(PIT)快照。
这些要求并不是传统NAS所能满足的。虽然NAS以良好的数据共享功能出名,但早期的解决方案在性能和容量扩展性方面并不尽如人意。为此,NAS厂商已推出了企业功能更强大的新技术,它们在可扩展性、功能、互操作性及成本效益等方面做了改进。
这些新技术有哪些?它们可为企业应用带来怎样的好处?本文分析了典型的大规模NAS部署场景以及它们的相似和不同之处,还介绍了三种NAS架构以供用户选择(传统NAS、并行和集群文件系统NAS以及集群NAS网关)。
两种NAS部署场景
大规模的NAS部署可分为两大类: 商业或者企业级数据共享;高性能计算(HPC)或者技术计算。这两大类又可细分为许多小类,进行笼统地划分是有用的,因为这体现了两者之间最关键的区别。
这倒不是说企业环境和HPC环境全然不同。它们确实有着共同的需求,从而使得NAS总体上非常适合这两种环境。
企业和HPC环境的相似之处
● 数据共享: 在企业应用和HPC应用中,多个客户机或者服务器之间的数据进行共享。NAS非常适合数据共享,因为网络上的任何系统(只要经过了合理验证)都可以存取数据。使用NFS和CIFS多协议存取方法,即可轻松共享Windows、Unix、Linux和Mac等平台之间的数据。
● 扩展性必不可少: 两种部署都需要大规模性能和容量,远远超出了前一代NAS技术的功能范围。比如说,医疗成像会生成容量非常大的文件,而动画和高清电视需要每秒数GB的吞吐量。另一方面,大学的主目录可能需要支持成千上万的用户。
● 可用性: 企业应用自然需要极高的可用性。企业NAS在可靠性和数据完整性两方面向来需要功能强大。因为NAS设备是专门为文件服务而设计的,它们往往本身就具有可靠性、可用性和可服务性以及集成的数据保护功能。
企业和HPC环境的不同之处
企业和HPC环境的不同之处比相似之处来得更重要,因为正是各自的需求所具有的特点定义了下一代NAS架构。
部署场景之一——企业应用
企业级存储合并实际上是工作组部署环境的大规模延伸。例子包括: 大规模主目录、企业级文件服务、Web内容分发、教育和医疗应用。
在企业环境,典型的部署目标就是合并服务器。由于目前部署在全球的微软Windows服务器多达数百万,合并成了很平常的问题。在一家组织内,如果服务器的数量超出了IT人员进行有效管理的能力,显然需要合并。随着服务器数量不断增加,IT管理人员往往会得出结论: 服务器合并方面的投资比不断添加人手更具成本优势。合并计划需要认真规划,因为预期的迁移(从许多服务器迁移到单一集中式解决方案)可能会对整个组织产生如下影响。
各部门争夺控制权和人事纷争
许多环境下的服务器合并计划面临的最大的障碍与技术无关,而是内部人事纷争及争夺资源的控制权。如果控制各自服务器的用户组不愿改用集中式存储,合并项目就会遇到困难。无论他们出于什么动机——可能是安全问题、隔离应用或者客户机、性能问题还是简单的地盘之战,合并计划都必须把服务器和存储合并带来的人事纷争考虑在内。
虚拟服务器融合合并和自主
对IT管理人来说,有两个选择。第一个是继续为某几个用户组维护不同的文件服务器(即NAS设备)。因为这有悖于合并的意义,所以并非最佳选择。另一个选择就是部署包含虚拟服务器的NAS系统。虚拟服务器是独立的虚拟实体(每个都有自己的名称、TCP/IP地址和存储容量),能够共存于一个物理设备里面。用户组保留了自主性,同时IT管理人员仍可以把硬件合并成数量较少的物理设备。如果性能是关注的问题,这个问题就很容易解决,虚拟服务器能够实现透明的负载平衡,从而消除瓶颈。
随机存取吞吐量扩展性
企业部署的另一个重要因素就是工作负载的性质: 数据存取往往具有随机性,分散于许多客户机。因此,随机存取吞吐量及无缝扩展随机存取吞吐量的功能就成了关键的指标。快速的随机存取吞吐量意味着客户机和服务器的工作效率很高,这就是为什么独立的性能基准测量组织SPEC.org在文件服务器基准测量中只报告随机存取吞吐量。面向事务和小型I/O工作负载的理想企业部署环境应当能够以透明方式扩展随机存取吞吐量。
可靠的多协议支持
多协议支持功能必不可少,因为企业部署系统通常包括混合的Windows、Unix、Linux和Mac等平台。合并项目想要顺利,跨所有平台的用户管理和验证就必须很容易迁离分布式环境。
快照
从磁带恢复数据是个费钱又费时的过程。快照(或即时映像)大大减少了从磁带恢复数据的需求,因而在企业NAS中对作为数据保护策略的快速备份和恢复而言必不可少。
易用性
企业环境需要易于管理、无特殊技能或者教育的技术。
部署场景之二——高性能计算
NAS的第二个新应用就是高性能计算即HPC。HPC环境与企业级合并大不相同,它往往更加呈集中式结构,而且通常支持某种特定应用,比如计算机图形、模拟、地震分析或者视频后期制作。与企业级NAS相比,HPC的服务对象是数量较少、在一个环境里面的客户机(通常采用一种平台)。
顺序存取吞吐量是关键
HPC的应用需求主要受性能的驱动,成功还是失败取决于一个特定的标准: 顺序存取吞吐量。HPC的工作负载往往由数量较少的设备生成,而传输的文件本身往往容量要大得多。数据更有可能位于单一文件系统,所以从该文件系统扩展存取吞吐量的功能就变得至关重要。从性能角度来看,吞吐量(每秒兆字节)比每秒的I/O来得更重要。
不大需要传统的NAS特性
HPC计算环境通常对企业环境所需的其他NAS特性要求极低。比如说,可靠的多协议支持并不是必要的,因为HPC环境通常以Unix或者Linux为主。快照也没有必要,因为这种解决方案并不是针对大型用户组而设计的。易用性在HPC技术环境往往不太重要,因为用户往往是本地用户,而且技术水平很高。
三种NAS架构对比
因为企业和HPC环境提出的要求截然不同,试图用一个解决方案来满足两者的需要没有多大意义。因而,厂商推出了针对每个环境进行了优化的技术。NAS网关和并行存取NAS分别为每一种环境提供了专门的方案。
传统NAS
先来了解一下传统NAS的基本特点。传统的NAS部署包括一个节点或者一对节点“NAS头”(NAS head),每个支持一组特定的工作负载和文件系统。在故障替换场景下,工作负载可以从一个节点转移到另一个节点,但它们通常位于一个NAS头上,访问节点之间共享的磁盘驱动器。
传统NAS的特点
● 简单的活动/活动架构,实现了冗余功能。
● 集成了磁盘和NAS处理器的“交钥匙”专用设备。
● 性能和容量的扩展受到节点的限制。
● 可靠的多协议和主机服务器平台支持功能。
● 文件系统与节点的绑定关系: 在任何时刻,一个文件系统只在一个节点上处于活动状态。
让人意想不到的是,说到存储容量扩展,易用性及可作为“交钥匙”专用设备来部署恰恰也是传统NAS的缺点。因为客户机和磁盘容量与其中一个NAS头或者一对集群NAS头有关,如果传统NAS的功能无法满足需求的增长,用户就必须人工迁移到新的NAS设备。需要不断迁移资源的管理难题最终成了限制企业增长的因素。
集群NAS网关
集群NAS网关消除了移动工作负载带来的破坏性,从而解决了遗留NAS的主要缺点。性能和容量可无缝扩展,不需要迁移数据,也不会影响用户。

为了做到这一点,集群NAS网关采用了虚拟化技术。客户机和服务器访问的虚拟服务器可以在集群里面的任何一个NAS网关之间以透明方式移动。因而,部署环境就能按需要扩展,以满足不断变化的需求。虚拟服务器支持合并,同时维护了自主性、可隔离用户和工作负载。应用服务器领域也有类似的这一概念。几家厂商提供了可在集群服务器环境里面创建多个虚拟应用服务器的软件。
集群NAS网关的特点
● 一个集群里面的多个NAS网关对服务请求而言可用性是独立的。
● 只要添加NAS网关,NAS网关集群的性能就可以扩展吞吐量。
● 在NAS网关之间转移虚拟服务器,即可以透明方式实现负载平衡。
● 多协议及平台(Windows、Linux、Unix和Mac)支持。
● 集成的即时(PIT)快照副本,实现数据保护。
● 可利用外部的开放存储系统,实现容量扩展。
集群和并行存取NAS
集群和并行存取NAS设备提供了根本不同于集群NAS网关的方案。这种方案为高性能计算和技术环境而设计,它提供了可扩展的顺序存取吞吐量,而不是企业NAS网关所具有的可扩展的随机存取吞吐量。
1. 客户机和服务器从虚拟服务器存取数据。
2. 多个虚拟服务器可位于一个NAS网关上。
3. 多个NAS网关可位于一个集群里面。
4. 只要移动虚拟服务器,就可以跨集群里面的NAS网关平衡工作负载。
5. 只要往集群里面添加NAS网关,即可扩展性能。
6. 虚拟服务器能够实现应用和工作负载的隔离和自主。
容量扩展性: 容量同样易于扩展。NAS网关以物理方式连接至存储池,那样只要往存储池添加更多的磁盘,就可以随时添加容量。
并行存取NAS的特点
● 文件系统横跨所有节点。
● 可同时从所有节点存取数据。
● 没有快照功能。
● 没有虚拟服务器。
● 没有存储资源自动配置功能。
● 可能需要特殊的主机或客户机软件。
可扩展的顺序存取吞吐量
因为数据从所有节点以并行方式存取,所以顺序存取吞吐量(即移动单一文件的可用带宽)是可以扩展的。虽然这种扩展性有助于数据流式传输环境,但在企业NAS应用中却实际上成了缺点。
原因如下: 在并行NAS存取架构里面,所有数据存取都会影响所有节点。每个I/O请求会给每个节点带来工作负载,所以随机存取吞吐量受到单一节点性能的限制,不会在添加节点后相应扩展。
并行存取NAS的一个变种可以提供可扩展的随机存取吞吐量。这种方案名为集群文件系统,类似并行存取NAS,因为文件系统可以横跨许多节点。因此,可以对集群进行配置,提供很高的流式传输吞吐量或者很高的随机存取吞吐量。就特定的文件系统而言,管理员需要选择顺序存取吞吐量还是随机存取吞吐量作为优先。
实施的集群文件系统通常缺乏高级的管理特性。因为这些产品只是文件系统而已(而不是全面的专用设备),管理功能与底层服务器具有的功能并没有什么不同。如果多协议支持、可变的I/O工作负载、快照、开放存储和易用性等特性对企业很重要,那么集群文件系统不是最佳选择。
特性集体现环境
通常来说,集群和并行存取技术的特性集经过了精简,致力于满足HPC环境的性能需求。因为HPC应用不需要传统NAS的全部特性集,比如数据快照、可靠的多协议支持和自动卷管理,因而可能没有这些功能。
哪一款适合你?
随着NAS架构不断发展,每种方案都有不同的因素需要考虑,如表2所示。 遗留NAS拥有出众的简洁性,但缺乏可扩展性; 集群NAS网关和集群或者并行存取NAS以不同方式克服了可扩展性方面的局限性。下一代架构让IT管理人员有机会可以充分利用NAS,将其用于新的一类应用,所以清楚这些方案的差异对部署适合每种特定存储环境的合理方案而言非常重要。
在选择NAS方案时要考虑的问题如下:
● 应用工作负载: 工作负载是由多个客户机和服务器生成的吗?
● 组织问题: 用户组希望拥有自主性、控制自己的服务器吗?
● 多协议支持: 会支持多个平台(Windows及其他平台)吗?
● 快照: 是否需要回滚功能(roll back)以恢复文件?
● 支持多厂商的存储: 可以重新部署现有的SAN或者其他磁盘以支持NAS吗?
● 性能: 文件是随机存取还是顺序存取?是大块I/O还是小块I/O?
● 易用性: 你对易用性有什么要求?你可以利用哪些技能组合?
● 增长: 你的增长计划是什么?