Chinaunix首页 | 论坛 | 博客
  • 博客访问: 130679
  • 博文数量: 145
  • 博客积分: 6690
  • 博客等级: 准将
  • 技术积分: 1650
  • 用 户 组: 普通用户
  • 注册时间: 2008-08-01 03:00
文章分类

全部博文(145)

文章存档

2011年(1)

2008年(144)

我的朋友

分类: 服务器与存储

2008-08-01 03:39:09

SNIA力促ILM标准化

今年7月出台的《SNIA信息生命周期管理(ILM)白皮书》是SNIA ILM技术工作组对其标准化所做的工作。这篇前瞻性文章旨在引发各个行业组织讨论在分布式、动态计算环境下管理与存储相关的资源。目前有许多相关工作正在不同的行业论坛当中开展,它们都以相同或者类似方式提供部分或者所有这些概念。本文阐明了自己的观点,旨在引起这些不同论坛进行讨论。

本文的读者群包括定义使用web服务的标准的组织,而这些标准涉及业务流程管理、企业内容管理、网格计算和记录信息管理。在一般情况下,读者群还可以是对全球网络存储工业协会(SNIA)在支持信息生命周期管理的数据管理标准定义方面的活动感兴趣的任何人士。

SNIA正在竭力统一存储资源管理方面的标准,而存储资源与信息生命周期管理(ILM)有关。ILM是业务驱动型管理实践,使用信息价值和该信息的处理需求,为数据保存、数据保护和数据安全等服务设定策略和服务级别目标(SLO)。

IT资源需要应对不断变化的业务需求。从业务需求转变为数据处理和数据管理需求,这势必需要业务部门的用户和数据中心的人员进行合作。如何管理数据成为这种转变的重中之重。

数据服务的管理最好作为几项基础服务的集合来加以提供。存储、数据保护和安全等基础服务密切相关,以至于其中一项服务的提供会影响到另一项服务的行为,这可能有助于整个服务提供,也可能有碍于服务提供。因此,通过单一集合来提供服务让数据中心可以为行为、可靠性及性能都能预测的服务,提供规划及测试配置模板。

毫无疑问,这只是为客户提供真正分布式、动态、异构的解决方案所需的一个方面。本文旨在引发行业组织之间的讨论,希望以此统一标准化工作,消除重复工作,至少获得整体解决方案的一部分。

1.SNIA眼中的ILM

信息生命周期管理(ILM)是一套策略、流程、实践、服务和工具,从信息创建之初直到最后被处理,使信息的业务价值和最合适、最具有成本效率的基础设施保持一致。通过与应用、元数据和数据相关的管理策略及服务级别,使信息与业务需求保持一致。

因为ILM的这种定义似乎涵盖了方方面面,我们不妨把定义简化为与SNIA及本文有关的一些方面。ILM提供了使业务需求和基础设施保持一致的手段。从SNIA的角度来看,这意味着必须有一套已定义、标准化的以数据为中心的服务、服务级别目标(SLO)及生命周期管理功能——这些功能支持以业务流程为中心的信息生命周期。同样,必须有一套标准化的属性,以描述异构存储配置的功能及为数据提供服务的相关数据管理功能。

SNIA在ILM方面的工作支持业务流程工作流的定义,包括文档在整个转换过程中的信息状态,但SNIA没有期望定义这方面的任何标准,因为这项工作对其他行业组织来说更合适。同样,使用服务级别目标(SLO)规定计算和网络需求无疑是ILM的一部分,但SNIA也没有期望定义相关标准,这些标准最好由其他行业专家来定义。

本文侧重介绍SNIA期望为标准制订工作贡献一份力量的方面,主要包括:

  • 定义标准的数据服务级别目标(SLO),备份、复制和网络存储等存储和数据管理产品可实现这些服务级别目标(SLO)。这种服务级别目标(SLO)是一种关键绩效指标(KPI),用来描述数据方面的服务级别,而不是描述应用性能方面的服务级别。正因为如此,它们可应用于各种类型的数据或者应用。
  • 存储和数据管理产品的服务聚合,这些产品旨在解决与法规遵从、参考数据和资源分类相关的重要客户管理问题。
  • 基于策略的数据生命周期管理,以便可以在数据生命周期中对数据进行合理分类和保存。这种管理为标准的数据分类定义做好了准备,而且还允许基于应用和内容的分类方法可以驱动数据分类。这种基于应用和内容的分类方法的定义超出了本文的讨论范围。譬如说,对数据进行分类以确定它可能受到哪些政府法规的制约,这就是知识驱动型活动。如果这种活动需要基于内容的分类,那么这项标准工作将可以通过外部分类服务来实现。

2.数据服务抽象

这项规范引入了抽象级别,如图1所示。这不是什么正式的架构,而是表明了功能的层次结构。

它被分为三个抽象层,外加第四个使用层——业务和管理应用。位于底部的是可通过存储和数据管理产品获得的原始功能。以存储管理为例,许多这些服务自最早版本的存储管理计划规范(SMI-S)以来就有了。以数据管理为例,许多这些服务还有待定义。

在单项资源上面的是为数据中心而规划的特定配置来组合这些服务。组合存储集(CSS)聚合了存储和服务,它们代表不同配置生成同等功能的特性。这一层还允许根据站点特定的需求和偏好进行定制,并且允许手动及自动创建配置。

数据服务由数据分类、生命周期管理和服务级别管理组成。它在存储行为和提供数据服务级别之间提供了一种转换。应用正是通过这一数据服务管理接口来指定数据需求为服务级别目标(SLO),数据管理层也正是通过这一数据服务管理接口来提供数据服务级别目标(SLO)描述的服务。这个管理接口可用来把数据生命周期作为一组策略加以定义及管理。数据中心的管理员(IT架构师和存储管理员等)负责定义提供数据服务级别和组合存储集之间的关系。实际上,这种层次结构里面的所有关系都基于管理员手动或者随着技术的发展、使用自动化程度不一的管理软件进行的映射。

总的来说,这种层次结构的关键要素包括:

  • 数据服务级别目标(SLO)的标准定义:这一概念为传达作为需求或者作为已定义服务级别的服务级别目标(SLO)属性提供了标准框架。这样一来,就可以独立于满足这些需求的功能,指定数据服务级别。随着功能因技术的进步或者环境的变动而发生变化,现有的服务级别目标(SLO)属性只需映射成新功能,不会带来破坏。客户端应用使用数据服务级别目标(SLO)来规定数据需求; 数据服务资源管理器使用数据服务级别目标(SLO)来定义数据服务级别。
  • 描述数据和存储服务配置的标准属性:这一定义专注于预期特定产品配置的性能和行为。负责确定这些预期的是数据中心,而不是厂商开发的工具或者文档。尤其是,这些功能不仅仅代表单一产品的性能和行为,还代表组合产品的性能和行为——为了提供可预测的服务级别,可能需要组合产品的组合配置。这个配置模板提供的“功能”被称为组合存储集。
  • 管理数据层的服务:提供这些服务的根本,主要包括如下功能: 配置、监控及控制数据管理服务,譬如数据备份、数据复制、数据安全和数据移动。这包括基于特定情况及基于策略来执行操作的功能。
  • 抽象配置及管理存储层的存储和服务:这将通过当前及将来版本的SMI-S加以提供。
  • 数据生命周期管理策略:这些策略允许自动化管理与促使服务级别目标(SLO)的变化适用于数据的事件相关的决策。这些策略来自信息生命周期需求,并指定了数据管理层里面的信息生命周期。
  • 数据分类:这种结构允许数据被组织成数据组以便管理,譬如服务级别管理和生命周期管理等,这可能包括自动化管理数据分类的策略。

概念模型

数据服务资源管理器里面体现了数据服务,图2里面的抽象层表明了这种管理器的诸多组件。这部分定义了与每一个组件及其基础服务相关的基本功能。ILM的“标准化”针对的是这些组件与服务如何衔接,以及每一个管理接口的定义。

数据放置、数据保护、数据安全、存储及存储服务:这是数据服务资源管理器的每种不同服务。每种服务必须为发现、配置和管理属于数据中心一部分的资源及功能做好准备,以便它们可以作为组合存储集(CSS)的一部分使用。这些原始服务可以作为不同的管理域加以管理,也可以集成到全面管理环境。不同服务通过CSS聚合到单一服务。数据服务还可以直接利用这些基础服务来提供直通式管理功能(譬如复制、删除、使其不可改变)。

组合存储集(CSS):CSS为配置及管理组合已知可以协同工作、提供可预测的服务级别的不同资源做好了准备。CSS通过作为CSS配置一部分的这些资源,为定义预期的行为和性能做好了准备。这表明要用专家知识把资源组合到工作配置中,并用来定义预期行为。CSS模型允许有不同的实现方式: 可以发现及记录数据中心里面的现有配置、由数据中心的架构师手动配置CSS,还可以根据每个对象或者每笔交易,完全自动组合动态选择的资源,以达到数据服务级别目标(SLO)。

数据服务:数据服务为数据分类、数据服务级别管理及数据生命周期管理做好了准备。数据服务组件为业务和管理应用提供了面向服务的接口,业务和管理应用使用数据服务级别目标(SLO)作为规定服务需求的属性。规定数据需求的服务级别目标(SLO)集合被称为SLOG即SLO群组。这种需求通常是使用者为了确定数据在生命周期中需要哪些服务而执行的分类流程的结果。

数据服务还可能使用SLO属性来描述数据服务资源管理器支持的数据服务级别(ODSL)。数据服务将管理功能,以管理ODSL和CSS之间的映射。

最后,数据服务还为配置及管理用来在信息生命周期中转换数据的数据生命周期策略做好了准备。

1.组合存储集

在为某个数据中心实现应用解决方案时,数据管理功能、存储与用于提供该解决方案的存储服务往往存在密切的依赖关系。组合存储集是一个特定的集合,结合了数据管理功能、存储和存储服务,数据中心的架构师(即IT架构师)在定义提供可预测的数据服务级别的解决方案时要用它们。
厂商和客户都面临的困境就是,不同产品配置的各种组合有可能会带来同等的数据服务级别。在任何一个点评估吞吐量或者可用性并不能足够准确地为不同组合(有时产品配置截然不同)描述总体吞吐量或者可用性。

此外,数据中心管理变化无常,以至于每个数据中心各自都有特定的细微差别,这些差别与厂商、配置及评估方法有关。为解决这些问题,CSS为这项功能做好了准备: 把数据中心的原始功能规范,定制成由数据中心管理的一系列特定配置的功能,这些配置可以在该环境提供特定的服务级别。至少,CSS是一种文档管理方案,可供IT架构师选择可用技术配置,以便可与提供数据服务级别之间来回映射。

2.数据服务

数据服务由数据分类、生命周期管理和服务级别管理组成。

(1)数据分类

数据分类是把数据组织成数据组,以便管理。分类方案的目的在于,根据数据组对业务的价值以及处理和存储需求,把服务级别目标与数据组联系起来。

数据分类的前身是信息分类,信息分类用于把数据组与特定的生命周期联系起来。一般可通过数据中心、业务部门、记录信息管理员及公司在获取及使用信息方面的其他利益相关者相互协作来获得信息分类方案。图3和图4阐述了这些概念。

信息分类不是SNIA标准工作的一部分,数据分类功能的管理才是标准工作的一部分。

(2)服务级别管理

提供数据服务级别(ODSL)发送给使用者,譬如业务和管理应用层当中的电子邮件或者企业内容管理应用,使用目前在通用信息模型(CIM)中实现的“功能”模型。

ODSL功能的属性基于数据SLO的属性,它们与分配数据服务级别目标(SLO)需求时作为“设置”所用的一组属性相同。数据需求的设置被称为服务级别目标群组即SLOG。

服务级别管理提供了创建及管理ODSL及其功能的功能,如图4所示。服务级别管理还提供了这一功能: 执行从数据的SLOG设置到ODSL、从ODSL到CSS的“最佳适合的”映射。

这些映射可以由IT架构师手动创建、基于由IT架构师定义的静态规则集由策略驱动,甚至可以由自适应策略引擎动态实现一组映射。

SLOG/ODSL和CSS的目的在于,提供两种“准独立的”抽象: 一种是描述数据需求和服务的特点,另一个是组织管理存储系统功能。通过把数据与SLOG和ODSL联系起来,我们可以让需求随着时间不断变化,只要重新分配数据与SLOG的关系。SLOG本身保持不变(当然,除非引入了新的目标。)同样,存储层或者数据管理层的拓扑结构、技术或者特点发生变化,可能不会改变CSS本身,只有表明这些CSS如何物理实现的映射才会改变。或者可以创建新的CSS,现有的ODLS可以映射成它们,从而让数据在将来迁移到更有效的资源,而不用改变需求。

(3)生命周期管理

数据生命周期是一种抽象概念,通过使用SLOG和SLOG分配策略来实现。数据生命周期来自并支持信息生命周期。这包括并非事先规划的特定的生命周期事件,譬如“现在运用这个SLOG”。信息生命周期和数据生命周期之间的区别包括:

“信息生命周期”定义了适用于数据的业务需求和业务价值,并定义了可能会在数据生命周期改变价值和需求的事件。这些通过信息以及/或者应用特有的关键绩效指标(KPI)来表达。SMI-S里面没有信息生命周期的模型。

“数据生命周期”定义了在信息生命周期的每个阶段都可以适用的数据SLOG,以及用来把数据转换成初始或者新的SLOG和SLOG分配策略。数据生命周期支持信息生命周期,但通过专门针对数据的术语来表示。数据生命周期是一种抽象概念,通过使用数据SLOG和SLOG分配策略在SMI-S建立了模型。

图3表明了这一关系的概念。

图5阐明了数据分类、服务级别管理和数据生命周期管理等概念。信息管理层的业务应用生成数据。具有ILM识别功能的业务应用可能会在数据创建时对其进行分类。管理应用可用来对数据由没有ILM识别功能的业务应用创建后进行分类。

进行的“最佳适合”服务级别映射是从数据生命周期每个阶段的所需SLOG映射到提供数据服务级别。如今,这通常作为业务部门的应用管理员和IT架构师或者存储管理员之间的讨论或者协商进行。另外,IT架构师定义了从每个ODSL到一个或者若干CSS的一组有效映射,这些CSS能够满足ODSL里面定义的服务级别。

图5中显示为“策略”的SLOG分配策略用来为数据生命周期的每个阶段应用一组新的数据需求。有时,应用新的SLOG会导致映射成新的ODSL,有时不会。同样,映射成新的ODSL可能会导致映射成新的CSS(参阅能够支持两个ODSL的CSS-y),也可能不会。映射成新的CSS可能会有后续行动,譬如数据移动到新的存储位置,还有可以确定是不是该删除数据的SLOG分配策略。

阅读(321) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~