分类: 服务器与存储
2012-05-28 13:18:06
信息呈现爆炸式增长趋势,存储需求急剧膨胀。根据研究显示,2020年数字宇宙将达到35.2 ZB(1ZB=100万PB=10亿TB),比2009年的0.8 ZB猛增44倍。高性能计算、医学影像、石油和天然气勘探、数字媒体和社会化WEB等大量数据密集型应用导致数据的“井喷”,不断对存储方法提出新的严峻挑战。其中,非结构化数据的存储需求尤为突出。ESG 2010年的研究证实,基于文件的数据(非结构化数据)远远超过了数据库(结构化数据)和电子邮件数据(半结构化数据),占2010年全球数据存档的75%。在可预见的未来,这种趋势还将进一步凸显。到2015年,文件数据消耗的容量超过20万PB。
基于文件的数据呈现爆炸式增长意味着企业需要在存储容量、数据中心空间、电力和冷却以及人力资源等诸多方面花费更高的成本来管理数据。如果仅仅从容量角度进行解决都会产生信息存储孤岛,不仅费用昂贵,而且利用率低下(通常不到全部存储容量的50%),因为它们无法在需要时与其他存储区共享可用的存储。面对大规模的数据增长,传统被动的解决问题的方法不再行得通,摆脱困境的唯一出路就是彻底改变存储模式,并采用不同类型存储基础设施来满足业务需求。如今,企业迫切需要借助虚拟化、扩展性和共享能力于一身的存储池来实现随时随地按需分配资源。为提供这种支持,存储池必须具备以下特性:
(1)虚拟化,旨在消除复杂性和物理基础设施管理
(2)可扩展,旨在根据需要透明地扩展容量和/或性能
(3)可共享,旨在任何需要容量的情况下优化利用率
(4)以策略为核心,旨在尽可能减少管理工作,实现高效运营
(5)适应性,旨在满足不断变化的存储需求并提供有效的长期存档
纵向扩展存储与横向扩展存储(源自ESG)
横向扩展(Scale-Out)存储有助于构建这一全新模式,通过创建存储核心架构来应对非结构化数据激增带来的巨大挑战。横向扩展存储系统的基础是NAS空间,可以添加若干并行工作的节点并作为一个节点进行管理,从而实现吞吐量和容量的独立扩展。在单一系统映像下,这些系统可以扩展到多个PB级存储,从而使它们成为理想的整合平台。横向扩展存储池可对底层存储进行虚拟化,创建可随业务需求变化而动态调整的资源,带宽、处理能力和存储容量可以单独调整和实时扩展。这种资源创建概念对当前持续不断增加的企业基础设施获得更高的可用性和可靠性至关重要。横向扩展存储有利于最大程度地降低管理成本、数据中心空间、电源和冷却需求。共享资源池可提供更高的利用率,极大地减少浪费。横向扩展存储的经济价值体现在改进扩展能力、加速配置、提升性能和简化管理、提高存储利用率等方面。
横向扩展存储系统克服了物理机架和模块的限制,可作为单一系统,通过增加控制器或是容量节点来实现性能和容量的独立升级,提高IT投入的回报率。同时,线性扩展能力为业务的长期高性价比提供保障。解决了传统单一系统,模块化系统需要物理磁盘级别的管理、数据布局和性能调优的弊端。横向扩展平台不仅能够提升性能而且还可以降低操作成本,使单一系统在单一全局域名下,简单地扩展到若干PB容量范围,成为管理猛增数据的理想存储平台。
2011年,由于企业IT用户对其存储系统的扩展性、灵活性和性能需求的增长,横向扩展存储产品和方案不断涌现。海外厂商EMC、HDS和NetApp首批推出新的解决方案,如:EMC的VMAX平台(SAN)和Isilon 产品(多协议);HDS的USP-V (SAN)、VSP introduction (SAN)和 HNAS (BlueArc-based NAS 系统);以及NetApp的GX (now ONTAP 8 Cluster Mode) NAS系统;而国内厂商华赛也在去年推出自己的平面扩展产品HS的OceanSpace 5000。同时,IBM的DS8000系列所构成的系统也具有横向扩展的特征;IBM SONAS 是针对Scale out NAS的解决方案,基于GPFS并行文件系统。HP的 P4000和P9000是通过LeftHand (iSCSI SAN)、IBRIX整合的横向扩展解决方案。此外,新添成员3PAR (SAN)使其平面扩展存储产品线布局更加完善;Dell的 EqualLogic (SAN)、Exanet (NAS)、Compellent 产品也进入了平面扩展存储市场。
在开源软件方面,也有许多横向扩展存储解决方案,比如Lustre, PVFS2, GlusterFS等集群文件系统,HDFS, KFS, MFS,FastDFS, TaobaoFS等分布式文件系统。