Chinaunix首页 | 论坛 | 博客
  • 博客访问: 520643
  • 博文数量: 213
  • 博客积分: 3076
  • 博客等级: 少校
  • 技术积分: 2158
  • 用 户 组: 普通用户
  • 注册时间: 2012-10-24 16:08
文章分类

全部博文(213)

文章存档

2013年(134)

2012年(79)

我的朋友

分类: 云计算

2012-11-14 10:21:03

企业级云计算存储技术白皮书
 
云计算中存储必备的 9 大要素
 
介绍
在最近对云计算的所有关注中,存储更多地被视为基础平台。时至今日,许多云计算提 供的仅仅局限于 CPU 内核的集合,定量的内存分配,低转速存储,或者还有一些面向互联 网的 IP 技术。 近来, 出现了有趣的与云计算和存储相关的高级技术, 特别是使用 Web Services 访问方式,使得访问存储不再受限于设备文件或者 NFS 加载点。
典型的数据存储和管理的“企业级特征”在 IT 架构创新上不断推成出新。存储架构师 意识到这些特征对于关键业务和生产应用非常重要, 但目前的云计算还缺乏这些特征。 本篇 白皮书的目标是描述企业云计算中存储必备的 9 个要素。
要素 1:性能 :
性能需要付出成本。在一个架构良好的应用里,性能和成本处于平衡状态。达到这点的 关键是使用合适的技术去匹配企业业务应用的性能,首先要求将企业的业务语言转换成 IT 模式。因为这种转换困难,通常企业止步于静态的 IT 架构,无法应对业务变化着的性能需 求。企业云计算提供了一个更能应对变化着的性能需求的平台。
在早期的云计算平台里,存储 I/O 一般都会有较高的延迟。这是因为厂商注意到使云计 算的数据更容易访问,但没注意到提高与性能、带宽和 IOPS 相关的服务级别。有两个原因 导致延迟较高:访问的模式和类型,以及存储分布的配置。
访问模式包括位于 OSI 模型物理层之上的多层协议的组合(如 SOAP, NFS, TCP, IP 和 FCP)。数据访问包括共享的物理服务层(如以太网)和几个协议层(如 SOAP 或 NFS),一般比 专门的物理层(如 FC)产生更多的延迟。市场上大多数云计算平台包括 Internet 的数据访问, 产生了更多的数据访问延迟。
对于存储介质,大多数云计算的市场在 RAID 或 JBOD 配置中使用 SATA 磁盘。因为 SATA(有段时间被视为近线磁盘)的性能一般比企业磁盘(一般指 FC 盘)稍差一些,导致存储 设备的性能低于应用的需求。
当你采用低性能存储介质的相对低带宽和高延迟的访问模式时, 使用整个存储子系统的 企业无法支持更多的关键业务应用的需求。其结果是,这种方案通常仅适用于测试和开发。
相比来说, 企业云计算平台需要提供更多不同性能存储层的选择。 当性能需求的变化时, 例如,应用从测试迁移到生产环境,存储平台应该能使用这种变化。理想的企业云计算的存 储应该有多种性能区,能够被调整,以提供合适的 I/O 性能级别给业务性能的需求。
最后, 为了满足企业高端存储的性能需求, 云计算方案必须采用高于或者目前正在使用 的企业级技术。一般使用 FC SAN。此外,如何使用技术与技术本身同等重要。在一个系统 管理环境里,企业级需求下的虚拟机配置必须能够持续提供高性能。
 
要素 2:安全性 :
安全性和虚拟化通常被视为相互矛盾的。 毕竟虚拟化使得应用从物理硬件和网络边界中 解放出来。安全性,换而言之,就是建立边界。企业需要考虑虚拟化设计的初始架构。
 
在大多数云计算市场里,无论公有的还是私有的,数据安全性都是基于信任 信任的,这信任 信任 通常都在管理程序里。当多数虚机共享物理 LUN,CPU 和内存时,由管理程序确保数据是 否毁坏或者被错误的虚机访问。 这与集群服务器多年来面临的基本挑战相同。 任何也许需要 接管进程的物理服务器必须能访问数据/应用/操作系统的权限。 例如, 为了主机外备份, LUN 也许需要映射给公共的备份服务器。
在企业云计算中,有两种方式去保护业务数据。第一种涉及系统程序管理安全。主要的 系统程序管理安全
系统程序管理安全 目标是:系统尽可能少地被使用,避免任何虚拟机被其他虚拟机造成负面的影响。企业也需 要保护 LUN 被其他服务器访问,如同主机外备份服务器。
其他需要注意的地方是数据通道。 数据通道 企业必须注意只能给需要维护必要功能的物理服务器 数据通道 提供访问路径。这可以通过 NPIV(SAN N 端口 ID 虚拟化)使用得 Zoning、LUN Masking、 访问列表、权限配置来完成。
 
要素 3:自动 ILM 存储 :
信息生命周期管理(ILM)曾经成为非常有效的市场行为的重心,被那些出售分层存 储的厂商所推崇。虽然 ILM 本质上非常简单 — 存储的成本与数据的业务价值相匹配,实 际的挑战来自于真正的执行效果,众多所谓的 ILM 方案,粒度都不够细,难以达到这样的 目标。
今天,传统的 ILM 并没有部署到市场上的大多数云计算平台中。原因有两个,第一, 在许多云计算中,大部分磁盘介质采用处于典型 ILM 方案中的最低层存储,这样就没法把 数据往更底层迁移,ILM 也就无法部署。第二,许多企业不需要为云计算常用的计算类型 而更长时间地管理数据,因为传统云计算通常用于功能测试/开发、概念验证(POC)、Web 服务器测试等。考虑到多种因素,实施 ILM 策略所需细粒度的复杂性和成本与经济节省的 云计算不相符。
 
根据一些行业报告,70%的数据是静态的。通过将合适的数据存储在合适的介质上,企 业能削减成本。他们能意识到通过部署云平台能节省成本,在云计算中实施 ILM 带来的经 济效益意义重大。但前提是无需中断应用,而且不能增加不必要的操作复杂性。
为了做到这些,企业必须使用基于策略的块级 ILM 方法,无论访问方式和应用类型。 通过在数据块一级跟踪数据的属性, 就无需在操作系统这一级执行数据归档或数据迁移。 这 种方法还能独立于操作系统类型, 且独立于用于存储数据的访问方式。 它不仅在保持性能(所 有的数据写入都在高速层完成)的同时优化存储的成本,而且通过将不使用的数据块沉淀到 低速层减少电能的消耗。这很合理,因为近线存储仅消耗企业存储的大约 20%的能耗。为 此,要做到真正适合企业级应用的自动分级存储,卷级 文件级 卷级或文件级 卷级 文件级数据迁移无法胜任,颗粒度 必须细化到数据块级 只有数据块级的数据迁移才可能独立于操作系统类型, 数据块级。 且独立于存储 数据块级 数据的访问方式,做到对应用支持的随需相应。
 
要素 4:存储访问模式 :
访问存储空间有三种主流方式: 基于数据块 (FC SAN 或 iSCSI) 基于文件 、 基于文件 (CIFS/NFS) 、 基于数据块 或通
过 Web 服务 服务。基于块和文件的访问方式在企业应用中最常见,能更好地控制性能、可 用性和安全性。在这点上,市场上大多数云计算平台利用 Web 服务的接口,如 SOAP 和 REST(代表性状态传输)访问数据。虽然,这是最灵活的方式,但有性能的影响。理想的情 况是,企业云提供全部的三种访问存储的方式来支持不同应用架构。
 
要素 5:可用性 :
IT 架构的维护窗口被大量的缩减,因为企业需要支持在不同时区的用户并保证全天候 的可用性。虽然服务级别协议(SLA)一般与可用性密不可分,从业务角度看,它难以衡量, 因为有着多种架构的复合 SLA 的重叠。
在前面提到,在市场上大多数云计算平台中,I/O 性能最先得到考虑。如果云平台依赖 于不被内部 IT 集团管理的部分架构,那么冗余的架构部分和途径是减少停机风险的最佳方式。虽然,云存储服务提供商在考虑成本的同时继续增加可用性,但是目前市场上的服务级 别协议不能满足企业关键应用的需求。
在高端的企业级云计算中,存储系统够出来企业内的企业级存储方案,包括多路径、控 制器、不同的光纤网、RAID 技术、端到端的架构控制/监控,和成熟的变更管理过程。在低 端的企业级云计算中, 存储可用性与今天市场上云计算平台的服务水平相当。 为了提供企业 需要的服务水平,企业级云存储供应商必须利用健全的架构设计和被充分验证过的创新技术。
 
要素 6:主数据保护 :主数据保护
主数据指的是在线运行的数据。 主数据能够采用单一技术, 或者结合多种技术进行保护。 一些常用的方法包括:RAID 保护、多份拷贝、远程复制、快照、和持续数据保护。 在市场上大多数云计算平台里,主数据保护的问题常常留给用户。今天,很少发现上述 的方法在大众云计算平台中使用, 因为技术的复杂性和成本。 有一些大众云存储方案通过维 护数据的多份拷贝来保护主数据,整个系统运行没有 RAID 保护的存储里,以此降低成本。 企业级云的主数据保护应该基于内部企业级方案。当方案的业务影响分析(BIA)需要 时,例如快照和容灾等可靠的技术应该就绪。 内部企业方案和企业云存储的主要差别在于, 主数据保护在方案中是如何绑定的。 为了 延续根据需要部署云环境的经验,各种选项必须打包,这样服务能自动部署。其结果是,将 一系列绑定的选项打包,能够应对大量需求。也许不存在可以利用快照、远程复制等与客户 需求相匹配的技术。无论如何,多数用户将意识到,常常需要牺牲灵活性去获取在企业云中 其它的管理好处。
 
要素 7:次级数据保护 :
次级数据来源于主数据的历史拷贝来形成备份。 这种数据保护意味着减少数据损坏, 恢 复被删除或被写覆盖的数据, 为了业务或法规的需要将数据长期保存。 典型的方案常包括备 份软件和几类存储媒介。 数据重复删除也许能被用上, 但这在关系到数据隔离的多用户环境下,可能产生些问题。 有些商业和公共领域上的方案,被加入到大众云存储中,以完成次级数据保护。但大众 云计算平台的供应商很少将这些与在线存储一并打包。虽然原因各异,但在许多情况下,与 恢复时间和保留期相关的服务水平(SLA)问题很难处理。 无论方案是私有的还是多客户云平台, 管理手段、 可见性和恢复的服务水平是次级数据 保护的关键。一旦提交恢复请求,恢复的启动应该直接而且能够自动完成。用户应该能掌控 可预见的恢复性能水平(恢复的数据 GB/时长),而且应该能从一个简短的选项列表中选择保 留的时长。最后,用户应该能检查那些在线备份的状态。因为频度和保留期决定了存储备份 所需的资源 — 也就是成本 — 客户应该能够在线观察资源使用状况和收费情况, 以免在结 账时感到意外。
 
 要素 8:存储的灵活适应性 :存储的灵活适应性
存储的灵活适应性是指能够根据业务的需要的变化做到存储资源的随需响应。归根结 底,它取决于操作系统对存储变化的检查能力和所使用的访问方式。 在这里讨论的 9 个要素里, 这一点是大众型云计算平台做得最好的要素。 大多数方案都 有按照预先设计的数量,逐渐增加存储的能力。删除空间也是一个选项,通常用于卷或加载 点。如上所述,操作系统对存储变化的应对能力通常是个局限。 支持企业云需求的存储需要能灵活扩展, 需按照客户能理解的方式计费。 虽然增加和删 除存储空间非常重要,用户倾向于仅为其用到的空间付费。他们也希望在基于 Web 的管理 方式下,具有调整和生成使用状况报表的功能。这种功能帮助他们控制成本,提供业务规划 的智能。
 
要素 9:存储报表 :
当公司考虑将其全部或部分 IT 架构外包的时候,经常顾虑的是这些特定技术的不可见 性。客户需要包括从容量和性能角度了解运行环境的状态。为了达到这个目的,通过用户管 理界面,输出丰富的存储报表成为必须,使得客户对于存储高效的运行充满信心。 在市场上云计算平台里, 与存储相关的报表是最基本的工具。 许多提供商提供标准的报 表来使用,在一些场合下,他们也提供基本的性能评估工具,或者来自提供商,或者来自共享厂商,或者是第三方工具。企业云比传统企业存储有优势,传统企业存储常常导致客户使用单一存储厂商的方案。 这使得报表非常简单,因为数据不用像来自多厂商平台那样,需要进行翻译,才能生成一份 统一外观的报表。 有关历史和实时使用情况的详细信息, 连同一些关键性能指标 — 历史的 或实时的 — 应该可通过用户管理界面 7x24 小时实时查看。最终,为了减少企业对失去控 制的担忧,云计算的提供商应该具备更综合性、更精确的报表能力,尤其是对于存储系统使 用情况的可见性。
结论
一个强健的企业级云不应该只片面关注 CPU、内存、磁盘、和 IP 地址分配,在规划企 业级云计算平台策略时,应该包括本文所提到的 9 大要素。这样,企业才能拥更完备的云计 算平台来支持业务运行。
注:美国 SAVVIS 机构(纳斯达克:SVVS)是全球领先的专注于建设、提供企业级云计算 平台(而不是大众型云计算平台)的服务供应商。SAVVIS 的企业级云计算平台包括遍布全 球的 28 个企业级外包数据中心,基础平台构建于 Cisco 网络服务、VMware 服务器虚拟技术 和 Compellent 虚拟存储系统。SAVVIS 的典型用户为大型企业级用户,而不是大众型云计算 的 SMB 或个人用户。
 
   详细地址
阅读(1141) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~