博客首页 注册 建议与交流 排行榜 加入友情链接
推荐 投诉 搜索: 帮助

漂在天堂的狼

出生在大漠之中,從北至南,從西至東,行程萬余里,終於來到人間天堂,開始了新的漂泊.
wantfly.cublog.cn


IT服务管理白皮书( 六)
第四章 服务管理产品介绍
4.1 服务管理的功能结构和产品分类


4.1 服务管理的功能结构和产品分类

在一个完整的IT服务周期里,服务提供(Service Delivery)和服务支持(Service Support),是用户可以切实体会并接触到的服务实体。服务提供(Service Delivery)定义了在节约成本的前提下,提供给客户的IT服务内容。服务支持(Service Support)则定义了IT部门对提供的IT服务所进行的支持和维护工作。

通 常说来,用户或者服务部门总是根据一定的商业目标定义出IT服务所需要提供的功能和实现的服务水平。这具体体现在应用程序管理,IT资源管理,安全管理, 软硬件资源管理等方面。实际上,服务管理所需要完成的工作涉及到企业IT运行环境的几乎每一方面。众所周知,随着IT技术的进步,以及企业信息化的发展, 现代企业的IT环境已经成为了比企业组织机构更为复杂的一个独立环境。而企业的组织机构和运作流程的复杂度增长,又对IT部门所提供的服务提出了更高,更 复杂的要求。所以随着企业规模的增长,总是伴随着企业IT环境的复杂度增长。从这个角度来说,服务管理要做的工作,以及服务管理所需要实现的功能是如此之 多,以至于难以逐一列举。从另一个角度来说,尽管服务管理的职责日益复杂,但每个复杂工作总是由若干更为具体和简单的工作所组成。因此服务管理的复杂功能 也总是由若干更为具体和简单的内容组成。我们不妨把这些内容称为IT服务所提供的“核心功能”。核心功能的实现,以及多个核心功能的组合,也就完成了复杂 的企业IT服务管理工作。

每一个IT服务所提供的核心功能总对应着一个相应实现一个或多个该功能的IT产品。而随着IT基础技术的不断进步,也不断产生新的核心功能需求以及新的 IT产品。但是,只要能够分析清楚IT服务管理的核心内容也就能够理清纷繁复杂的服务管理产品后面所隐藏着的脉络。

服务提供所包含的核心功能主要分布在:
服务水平管理(Service Level Management)
可用性管理(Availability Management)
能力管理(Capacity Management)
业务持续性管理(Business Continuity)
财务管理(Financial Management)
等环节中。

而服务支持这一过程所包含的核心功能主要分布在:
配置管理(Configuration Management)
事件管理(Incident Management)
问题管理(Problem Management)
改变管理(Change Management)
发布管理(Release Management)
等环节里。

4.1.1 服务水平管理(Service Level Management,SLM)

IT服务水平的竞争也许是现代IT企业竞争中最激烈的一种。这种局面是由于客户的快速成熟所造成的,他们总是希望能在购买商品的过程中获得更好的服务,而IT本身就是服务的一部分。

对很多企业而言,IT服务水平管理并不是一个新的服务种类。服务水平管理定义了在节约成本的前提下,用户所能得到的各种IT服务的标准,如何监控IT部门 所提供服务的质量,以及评估服务水平的手段等。一个常见的服务水平管理例子如:IT部门承诺在不追加投资的情况下,公司的CICS交易管理服务器可用率达 到95%(Availability Rate >= 95%)。

一个地区的两家银行之间不可避免的存在激烈的竞争。而现在,对客户的服务不仅仅限于舒适的环境,亲切的笑容和温和的话语,客户可以直接通过ATM机进行交 易而不接触具体服务人员。在这里,IT也成为企业服务的一部分,客户的流失可能仅仅因为另一家银行的ATM机的交易速度比你快几秒。如何提高竞争力?鉴于 IT设备和IT人力成本的昂贵,盲目的设备和人员扩充可能更象是饮鸠止渴。因此,企业必须找到行之有效的管理方法,使现有的IT设施发挥出最佳水平,保证 为用户提供最有效的服务。这就是服务水平管理(Service Level Management),即SLM。

SLM是一种严格的超前方法论和处理程序,它被用来保证在有效的资金利用率下,能够向所有的IT用户传递足够级别的服务,以确保业务能够得到相应的优先权 来优先处理。SLM可使IT部门根据“购买”服务的业务部门对不同的服务类型、成本和服务水平的要求,来提供面向业务和企业范围的服务。SLM需要IT机 构充分了解它所能提供的各种服务,以及相关的优先权和业务重要程度。

从这个角度出发,SLM产品应该具有四大功能:监控、报告、分析和管理。企业现在要实施SLM比以往简单得多了。在过去,收集有用的数据和产生SLM报告 是一件进展缓慢和费时费力的差事,有时还要编写定制的程序,购买昂贵的数据收集产品,结果却收效甚微。现在这一情况大为改观,一些新产品所提供的向导程序 使数据的收集处理过程、不同数据源间的数据合并和数据关联变得非常方便。

IBM公司早在90年代初期就对IT服务水平管理给予了高度的重视,并始终在这一领域保持着领导者的地位。IBM的服务水平管理软件IBM Tivoli Service Level Advisor深刻体现了IBM公司在IT服务水平管理方面的思想,是辅助企业进行IT服务水平管理的利器。

下图描述了IBM Tivoli Service Level Advisor的系统结构。IBM Tivoli Service Level Advisor可以划分为SLM服务器,报告服务器和管理服务器,可以完成包括数据收集,策略规划,制作报告,服务评价,服务水平升级等各种服务水平管理方面的功能。

4.1.2 可用性管理和安全管理

可 用性管理(Availability Management)和安全管理(Security Management)有着紧密的关系。从它们所涵盖的功能范围来看,我们可以理解安全管理是可用性管理的一个子集。而从实际应用的角度来看,系统软硬 件,企业业务应用系统以及企业业务数据的安全管理深刻的影响着企业IT环境的可用性。

4.1.2.1 安全管理

在目前的IT环境下,“安全管理”已经成为一个不可回避的话题。一个有效的安全管理解决方案。可以帮助企业降低管理成本,提高业务系统运行的安全性,帮助企业减少收到攻击或者过失操作而带来的意外损失。

从可操作的角度来看,安全管理可以划分为:

具体的用户管理,访问控制以及全局的企业风险管理和监控。

在当前复杂的IT应用环境下,用户的管理已经成为了一件复杂的工作。下面是一个常见的应用案例:

    一个新员工加入公司,他需要有A,B,C,D,E五个系统的权限。在不同的系统上,他所拥有的权限大小也不一样。如果同时加入公司的不是一个员工,而是10个员工该怎么办?
    如果这五个系统又不幸分布在不同的计算机上,这又该怎么办?
    如果用户在不同的系统上有不同的用户名,那当用户需要同时访问多个系统的时候,是否需要反复输入不同的用户名和密码?
    类似的问题还有很多,实际上,用户管理和访问控制是一个老生常谈的问题。但当企业的IT架构越来越复杂的时候,当新系统和旧系统交错存在的时候,这样的问题是服务管理员抹不开的心病。

电 子商务发展的快速步伐意味着更多的企业系统、应用程序和数据可在互联网上访问。其结果是,业务面临着来自于多方面,不仅是企业外部,也来自企业内部:病毒 威胁、非法访问、拒绝服务攻击和其它形式的入侵,这些威胁直接瞄准电子商务应用、网络、托管基础设施、服务器和用户的桌面系统。

在这个高度竞争的世界里,客户的要求也非常苛刻,他们期望得到公司的最高质量服务、信任和安全。因此,电子商务的实施应该是安全的,同时允许业务交易的保 密性,保护业务运做的完整性,保护客户数据,并且提供全天候的访问。精心打造品牌资产的商家都了解,在互联网世界,品牌资产有可能被一次攻击快速地腐蚀或 破坏掉。

因此,从任何一个角度来说,只要企业希望安全的生存,就必须对风险的管理有足够的重视。

一般说来一个优秀的风险管理软件应该具有这样一些特点:

  • 提供了一个描绘出所有安全弱点的企业中央视图;
  • 能够极大地减少对安全软件收集的实时数据进行人工分析的时间;
  • 能够通过强大的决策支持和报告功能增强对威胁的防范能力;
  • 能够采取基于规则集的自动纠正措施;
    能够时刻监控企业可能遭到的各种攻击情况;
  • 能够高度客户化(以反映每个公司独特的配置、访问点和通信流模式);
  • 跨平台和基于开放标准;
  • 能够通过扩展来支持快速增长?是否能够提供高可用性;
  • 方案供应商拥有全球性的资源和研究设施,以主动维护自己在安全研究和开发(R&D)领域的领先地位
  • 最后一个特点是非常重要的,因为敌意攻击的手段和方式都在日新月异的变化,如果方案提供商不能在这场角逐中始终保持领先地位,则会让客户的应用系统处在一个危险的境地。

从这些角度出发,类似IBM这样应用经验丰富,研发能力杰出的公司才是客户应该选择合作的对象。

下图是IBM公司实现安全管理的产品家族结构:

这些产品及其所具有的功能如下:

IBM Tivoli Access Manager for e-Business
完成对企业Web应用的保护工作,包括SSO在内。

IBM Tivoli Access Manager for Operating System
完成对UNIX、Linux操作系统的保护工作

IBM Tivoli Identity Manager
统一管理企业的用户,包括用户ID和用户密码的统一管理

IBM Tivoli Directory Integrator
同步不同应用的用户数据

IBM Tivoli Directory Server
标准的LDAP目录服务器

IBM Tivoli Risk Manager
集中管理企业所有的安全事件

4.1.2.2 可用性管理

系统的可用性管理核心功能可以划分为:可用性环境建模,可用性监控和可用性历史数据分析三大类。

可用性环境建模是指在搭建IT应用环境的时候就已经考虑到可用性方面的因素,从而使建立的IT系统在基础结构上就具有较强的高可用性。例如,在搭建一个新 的存储局域网(SAN, Storage Area Network)环境的时候,用户完全可以利用可视化的工具,充分考虑到整个SAN环境中需要重点保护的环节和容易出现故障的环节,并对症下药设计出整体 具有较高可用性的SAN解决方案。IBM公司针对用户这方面的需求,提供的软件产品是IBM Tivoli Storage Area Network Manager。

系统的可用性来自于对系统运行环境和运行状况的了如指掌。因此,“监控”也就成为了保证可用性的有效手段。实际上,随着IT基础设施复杂程度的升高,已经 凸显了对IT资源进行监控的重要性。在现代企业的IT环境里,监控系统的作用早已超出了简单显示网络、操作系统以及计算机硬件设备的工作环境和工作状态的 范围。数据库、中间件解决方案和业务应用软件业也成为了监控的目标。而且,监控系统不仅是要时刻掌握企业IT环境的健康状况,更重要的是能够帮助用户快速 地找到系统的故障、系统运行的瓶颈以及性能降低的根源,而不必对大量的原始数据进行分析。

监 控系统可以帮助服务管理员找到IT环境里的性能瓶颈和潜在问题。但用户要的或许更多。这样的瓶颈和问题对业务究竟有怎样的影响?企业经营者和IT技术人员 看待问题的角度并不完全一致。实际上从企业经营者的角度来说,业务系统的重要性是不一样的。有些业务系统并不重要,出现问题可以有一个相对缓冲的时间去解 决,而有些业务系统十分重要,出现问题需要马上处理。而技术人员看到每一个报警信息都会去处理,因为对他来说所有的设备的重要性都是一样的。为了更好的让 IT系统为企业经营服务,应该在IT系统和业务系统之间搭建更为清晰的桥梁。当有了这个桥梁以后,枯燥的IT环境将发生了根本的改变,IT设备有了个性, 即每个设备都是有自身的优先级的,需要分别对待。而业务部门将能够非常清楚地在业务逻辑视图上看到哪些业务子系统无法正常工作了,从而可以有时间进行提前 的准备和进行相关的预备工作。

监控系统与可用性历史数据分析之间有着密不可分的关系。监控系统往往就是可用性历史数据的来源。所以监控系统和可用性历史数据分析系统常常被集成到同一个产品中。

IBM公司在IT系统可用性管理方面有非常丰富的经验并拥有非常完善的产品家族。其中最典型的产品包括IBM Tivoli Monitoring ,IBM Tivoli Netview,IBM Tivoli SAN Manager,IBM Tivoli Enterprise Console和IBM Tivoli Business System Manager等。

下图是IBM Tivoli Business System Manager的应用示意图。利用TBSM,用户可以直观的看出某个IT基础设施的故障给整个企业业务系统造成的影响。

4.1.3 能力管理(Capacity Management)

能 力管理涉及的范围包括资源能力的管理,服务能力的管理和业务能力的管理。落实到实际的IT系统环境中,资源能力的管理占有重要的地位,而后两者更侧重于咨 询服务和组织结构的设置。资源能力包含存储能力和计算能力。而资源能力的管理一般可以划分为三个环节,分别是:能力需求分析,能力数据管理,和能力使用情 况监控。有效的资源能力管理,可以最大限度的发挥企业现有资源的利用率,降低企业的采购成本,降低服务管理的复杂程度,同时提高服务管理的灵活性。

4.1.3.1 存储管理

作为企业最可宝贵的财富之一,“数据”在企业中的地位毋庸置疑。任何形式的数据都必须依赖某种形式的存储而存在。因此存储管理便成为了企业服务管理中非常重要的一个环节。

存储管理涉及的核心功能一般说来可以划分为以下两个方面:

1. 构建合理的存储结构

对大多数企业来说,存储的环境是一个典型的异构环境。种类繁多的存储设备来自不同的厂商,遵循不同的标准,使用不同的接口。这样的环境为服务管理人员带来 很大麻烦,同时也很容易造成资源的浪费。一个典型的场景就是:

当A系统存储空间已经爆满,需要扩充时,B系统的存储空间还有很大富余,遗憾的是B存储设备无法为A系统使用。

为了避免这一场景的频繁出现,我们不妨设想一个完美的存储环境 – 虚拟化的存储环境:

在这样的环境里,虚拟化存储在用户与物理存储设备之间加入了一层抽象物质。各种存储设备仍在使用,但它们按照事先确定的优化利用率的策略集中在一起,形成一个虚拟存储空间。

这是一个简单的例子:用户服务器上的硬盘也许只有40G,但通过使用虚拟化技术,服务器上的硬盘空间可以得到几乎无限的扩展,无论数据实际保存的位置在哪 里,也无论它被保存在什么介质上(也许是光盘,也许是磁带,也许是10公里意外的一个磁盘阵列)。服务器都始终能够像数据保存在本机硬盘上那样存取数据。 当A系统再次出现存储空间不足的时候,管理员可以很轻松的从巨大的“虚拟存储池”里为A系统分配更多的空间,而不再担心存储设备能否被A系统所识别。
  具体而言,虚拟化的存储让客户以“透明”自动的方式在磁盘或磁带上存储数据。在虚拟存储环境下,服务管理员不必再关心物理存储设备的特征,只需专注于管理存储空间。而这一工作也将变得非常的简单。

对用户来说,存储虚拟化带来的益处是显而易见的,首先是提高了存储效率,降低了存储投资的费用;二是简化了存储管理的复杂性,降低了存储管理和运行成本。 根据Evaluator Group的调查报告显示:传统的存储环境中,开放系统的容量利用率仅为40%~50%,这种低使用率造成了企业不得不耗费大量的额外成本满足存储扩容的 需求。而构建虚拟化的存储环境则可以减少或者避免这种情况的发生。

IBM公司在存储虚拟化领域占据着领先的地位,典型的应用于存储虚拟化的产品有IBM公司的:

IBM TotalStorage SAN Volume Controller
IBM TotalStorage SAN Integration Server
IBM TotalStorage SAN File System
IBM TotalStorage Productivity Center等。

2. 优化存储设备的利用率

对企业来说,“数据”是宝贵的资源,而承载数据的载体-“存储设备”也是一笔不菲的开销。IT的进步给现代企业带来了更多的选择,高速硬盘,可读写光盘, 磁带,光纤盘柜,高容量带库等等。这些设备具有不同的读写速度性能,也具有不同的容量,相应也具有不同的使用成本。怎样合理利用这些种类繁多的存储设备, 怎样让每一块好钢都用在刀刃上?是服务管理面对的一个重要课题。

合理的存储利用方式应该是:用高速存储设备应用于应用密集型的环境,如生产数据库,频繁被查询的数据库放在高速硬盘,或光纤盘柜中;用低速,大容量存储设 备存储历史数据,例如将超过三个月未曾被人访问过的数据存放在带库里。这样就形成了一个层次形式的存储架构。理想的情况是,高速设备上的数据往低速设备上 迁移这一过程是对用户透明的。例如企业的票据,当在高速硬盘上存放三个月没有被人访问过以后,将依据规则自动迁移到带库中去;而当某天,用户需要读取该票 据的时候,用户无需知道票据的实际存储位置,用户只需要按照正常方式访问该票据,存储系统将自动把票据从磁带上取回,重新存放到磁盘上,再反馈给用户。

毫无疑问,具备这样功能的层次型存储管理软件将大大降低存储设备的购置花费,提高存储设备的利用率,并减轻服务管理人员的工作量,同时从人员和资金两个方面节省了企业的使用成本。

目前,软件市场上能实现层次型存储管理的软件中,IBM的Tivoli Space Management是一个杰出的代表。除此以外IBM Tivoli Storage Resource Manager(ITRSM)也是实现存储能力利用率提高的一个有效工具。ITRSM可以帮助用户规划存储资源的分配,管理并记录当前存储资源的分布状 态,同时监控当前各种应用耗费存储资源的情况,并根据实际的需要动态分配存储资源给需要的业务系统。

下图描述了ITRSM的工作原理和分布架构,通过ITSRM的Agents,用户可以通过浏览器远程监控和管理各种服务器包括数据库应用的存储资源利用情况。

监控得到的结果可以非常直观的通过各种图表得到体现,如下图所示:

4.1.3.2 计算能力的有效利用

企 业的计算能力是指企业内部各种类型计算机所具有的运行企业应用的能力。根据Gartner的统计结果,在目前的IT环境中,企业的计算能力存在着惊人的浪 费,传统的服务器配置导致系统的利用率只有15%-20%左右,而大部分的系统计算能力是被空置浪费的。从这个角度出发,似乎企业内部总是有富余的能力可 以游刃有余的处理客户的请求。但实际情况呢?

下面是一个现代企业运营过程中经常出现的例子:

A是公司电子商务网站的网管,他最头疼的就是当有促销活动和节假日时,网站的访问量激增,但是又无法预测到底能有多少访问量。实际上当访问量激增的时候, 公司的服务器总是出现明显的负载过重现象,客户总抱怨网站速度很慢。公司同时还有其它的业务系统,上面的负载很小。这时,A经常梦想能够分享那些业务系统 计算机的处理能力。实际上,A曾经尝试过,从别的生产系统中,借来两台服务器以应对网站的访问高峰。但是,繁琐的安装和配置过程也要浪费大量的时间。

事实上,这才是大多数企业目前的计算能力使用状况。有没可以改善的办法呢?

一个理想的方案是:

一旦服务器达到应用极限,它就可以自动的从一个计算能力资源池里启用适当的资源分流工作量。新资源可以根据实际需要进行配置,一旦应用高峰期结束,网络流 量下降,这些辅助资源又可以投入到常规工作之中。所有的一切工作都自动发生。而且这个方案还支持多种异构平台,能够满足企业多种多样复杂的环境的需求。

在IBM这样的解决方案叫做Infrastructure Orchestration(基础设施的管弦乐团)。的确,在应用这样的解决方案过程中,服务管理人员就如同指挥家一样,能够把底层资源与高层需求联系起 来,这也是一场管弦乐演出能否成功的关键。它能够在核心的自动化规则比如可用性、安全、优化和预先配置之间进行协调,根据应用的优先级自动分配资源,确保 需求达到峰值时的应用服务水平,并可按照渐进方式比如从手工、半自动到自动化的方式逐步实现自动化。能够将用户的资源利用率从平均20%提升到50%,并 减少30%-40%的管理时间。

目前支撑这种解决方案的产品有:Tivoli Intelligent ThinkDynamic Orchestrator和IBM Tivoli Provisioning Manager。在2003年9月份举行的美国网球公开赛上,IBM Tivoli Intelligent ThinkDynamic Orchestrator已经成功亮相,它与IBM Tivoli Provisioning Manager一起帮助公开赛的IT系统能够在正确的时间为合适的应用调配合适的资源,成功保证了该赛事的网站实现优质服务,处理每天420万次的点击。

4.1.4 IT服务持续性管理

IT 服务持续性管理是指确保发生灾难后有足够的技术、财务和管理资源来确保IT服务持续性的管理流程。IT服务持续性管理关注的焦点是在发生服务故障后仍然能 够提供预定级别的IT服务从而支持组织的业务持续运作的能力。从企业实际运作的角度来看,由于灾难和故障的发生是不可预料的,所以服务持续性管理的根本目 的是尽量缩短企业IT系统因为灾难和故障而停滞的时间。从而我们也可以理解IT服务持续性管理也就是快速故障恢复管理。而实现系统快速故障恢复,最有效的 工具就是建立一个完善的备份系统。

备份,是保存业务数据的最好手段。当生产系统出现故障,导致系统停机的时候。用户可以利用备份的业务数据实现生产系统的快速恢复。从而最大限度的将事故造成的各种损失降低到最小。

但是,备份作为保护生产数据的一种操作,必然会占用生产环境额外的资源,例如网络带宽,CPU利用时间等等。而不同的备份方式所占用的存储空间也不一样,例如全备份与增量备份所占据的存储空间就相去甚远。

备份的根本目的是为了在事故发生时能够快速恢复生产系统,因此如何能够缩短恢复的时间;如何能够让损失的数据量降低到最小;这些都是存储备份软件所必须要考虑的内容。

综合考虑众多的因素,一个接近完美的存储备份解决产品应该具备这样的一些特点:

  1. 备份功能完备,尽量减少对生产系统的影响,尽量减少存储的空间
    一个好的存储备份产品,应该可以支持多种备份方式,既可以支持文件的备份,也支持应用的备份(例如数据库的备份,应用服务器的备份);既支持离线备份,也 支持在线备份;既支持全备份,也支持增量备份;既支持基于LAN的备份,也支持LAN-Free形式的备份。如果使用在线的增量备份,一方面企业的生产系 统照常运行,不会发生生产停顿的状况,另一方面,存储所占用的空间将大大减少。从而一方面降低了生产停顿造成的影响,另一方面也降低了存储的成本。
  2. 恢复速度快,恢复的方式灵活多样
    一个好的存储备份产品,必然也是一个恢复速度极快的产品。备份是防患于未然,恢复是救企业于水火。因此,高的恢复速度,可以大大降低企业的生产损失。同 时,用户对恢复的要求也是多样的,有的要求恢复到最近的状态;有的要求恢复到某一时间点;有的要求全部恢复;有的仅要求恢复某一部分数据。好的存储备份产 品,应该能够完全满足这些要求,从而缩短用户操作的时间,带给用户更多的可选性。
  3. 支持软,硬件平台广泛
    现代企业的IT应用环境几乎都是异构的,同一个企业内部同时拥有多家厂商的软,硬件产品。一个优秀的存储备份软件,必须能够尽可能广泛的和这些产品相兼容。
  4. 完善的自动化工作机制
    备份是一个需要经常,定期执行的操作,提供完善的自动化工作机制可以减轻服务管理人员的工作量,同时也提高备份操作的准确性。
  5. 完善的灾难恢复机制,完善的远程备份机制
    灾难总是突如其来的发生,一个完善的灾难恢复机制可以帮助用户在受到灾难袭击时,可以从容的面对,尽可能快的实现存储备份环境的恢复,并进一步实现生产环 境的恢复。同时,远程备份已经成为了很多企业,特别时跨地域企业的基本需求。有效的远程备份可以进一步提高备份数据的安全性。
    存储备份管理可实现的功能特点还很多。但是以上的要求应该是一个优秀的存储备份软件的必需条件。目前软件市场上流行的备份软件不少,IBM公司的Tivoli Storage Manager就是其中的佼佼者。以上列举的功能要求只是Tivoli Storage Manager能够实现功能的一个子集。

4.1.5 财务管理

IT 服务管理中提到的财务管理主要是指负责预算和核算IT服务提供方提供IT服务所需的成本,并向客户收取相应服务费用的管理流程,包括IT投资预算、IT服 务成本核算和服务计费三个子流程。对实际的IT应用环境来说,主要体现在服务或产品授权许可的管理,企业现有软硬件产品的成本管理等。

IBM公司在IT服务财务管理方面提供的产品主要包括Tivoli License Manager和Tivoli Inventory。

4.1.6 服务中心(Service Desk)

在企业的实际运行中,服务中心是一个技术支持机构,同时也是服务支持(Service Support)周期中,最直接面向用户的一个核心服务内容。

作为一个技术支持机构,服务中心的工作是负责维护IT部门提供给最终用户的各种IT服务。在整个IT服务支持环节中,服务中心也是最终用户可以直接接触到 的唯一IT服务部门。当IT服务出现问题时,用户通过服务中心把问题反应上来。服务中心按照规定的服务规范和服务准则,分清楚问题的种类,协助用户查清楚 产生问题的根源。对大多数日常操作中出现的常见问题,服务中心可以通过远程或者到现场的方法协助用户排除问题。对一些比较复杂的问题,服务中心可以把问题 转向更高级的服务提供部门,要求协助;并在获得答案后,按照正常的服务流程,为用户提供相应的服务。服务中心的最主要目标是为客户提供一个唯一的IT支持 接触点,以最快,对业务影响最小的基础上实现IT问题的解决。

作为一个产品,服务中心可以接收并记录所有由用户提交上来的各种服务请求,记录服务中心工作人员的日常工作情况,可以追踪每个请求得到的服务响应,也可以 紧密结合其它的服务支持工具,例如配置管理软件等,直接帮助用户排除故障。

Remedy公司的Help Desk是目前应用相当广泛的服务中心软件。它是一个非常灵活,界面友好的工具,提供了包括Web,电话,电子邮件,等多种接口。用户可以使用这多种接口 中的任何一种与服务中心取得联系,与服务中心的工作人员友好交互,并获得服务中心的帮助。Remedy Help Desk与企业内的IT服务支持和IT服务提供工具和流程紧密集成,IT服务人员可以很方便的通过Help Desk,利用IT服务支持工具和IT服务提供工具为客户提供IT服务。

目前业界比较著名的服务中心软件还有Peregrine Service Center和Whitestone Servie Center。

4.1.7事件管理和问题管理

从产品功能的角度,事件管理和问题管理有很多重叠的部分。用户总是在获取的大量事件中找到产生故障和意外的根源,然后才能提出解决问题的方案,并记录解决问题的过程和经验。

事件管理的功能侧重点在于在IT服务的正常提供过程中,尽快发现各种系统运行时出现的故障和问题,并快速排除这些问题。事件管理一般会利用服务中心记录这 些问题和问题的处理过程,并把典型的问题和问题处理过程存放进服务支持知识库以备以后参考。

错误管理的功能侧重点在于通过研究知识库中对各种问题和故障的记录,寻找出相关故障发生的根本原因,并提出相应的长期解决方案。有别于事件管理的是,事件 管理更偏重尽快,及时的解决问题,因此提供的解决方案有可能有一定的临时性,其目标在于尽快恢复正常的生产;而错误管理更偏重于通过研究,发现问题的共 性,认识清楚问题的本质,提出的解决方案也具有通用性和彻底性。因此,错误管理所涉及的功能内容一般包括:问题的鉴别和数据的收集,以及历史问题的分析。

在实际的生产环境中,异常事件的发生往往是不可避免的。系统发生故障或速度变慢都会降低员工的生产力,降低客户满意度甚至丢失客户。避免此类故障并保持最 佳性能的关键在于,在问题变得更严重之前快速地诊断并解决它们,但是现代企业中高度互联的IT系统往往会使得这种诊断变得困难、低效而且花费昂贵。一个很 典型的应用情况是,一个数据库管理系统往往拥有好几个下游的系统,例如若干个共享数据库的企业应用等等。而当这个数据库管理系统发生故障以后,往往会迅速 导致所有与之相关的业务系统发生故障,以至多个下游组件发出相应的警告。因此监控系统将会捕获大量的错误信息和警告信息,随之引起的混乱将导致时间与精力 的浪费。

鉴于异常事故的不可避免,如何有效的处理事故发生时产生的各种事件?如何尽快从这些事件中挖掘出事故的根源?这就是事件管理和问题管理软件所需要处理的难题。

毫无疑问,有效的事件管理和问题管理,可以很大的提高企业应用系统的稳定性,减少企业事故发生时所遇到的损失,缩短企业恢复生产所需的时间。

IBM公司在事件管理和问题管理领域一直保持着巨大优势,其该领域的拳头产品IBM Tivoli Enterprise Console(TEC)在业界享有盛誉。下图描述了TEC的产品组件之间的关系。

TEC 通过对IT基础设施的宽度覆盖(包括网络、服务器、应用和安全),能够实现在一个点上对重要信息的整合。TEC可以进行智能化多级分析和关联,过滤掉容易 使人产生误解或冗余的事件,突显重要信息,指导客户的支持人员快速准确地把握问题根本原因 。它甚至可以根据用户的定义自动对突发事件作出响应。对于发送到控制台的重要事件,TEC提供可定制的显示方式确保用户的操作员只看到与他们工作相关的事 件,帮助他们集中精力处理关键的事件,从而使用户能够处理最大、最复杂的环境。在TEC的客户中,一家使用这种多级关联的欧洲银行曾成功地将环境中的 300,000个事件锐减到了30个。

除TEC外,Remedy公司的Remedy Help Desk软件也是业界常用的事件管理和错误管理工具。实际上,由于Remedy Help Desk作为建设服务中心的常用软件,经常与IBM公司的TEC配合使用。

4.1.8配置管理和发布管理

配 置管理是每个IT 组织都要面对的一项工作。配置管理的目标是识别、控制、维护和检验现有的包括基础设施和服务在内的IT资产,它首先维持配置管理数据库(CMDB)中每个 IT基础建设的配置记录,同时提供配置项目(CI)的报表。这包含了一些管理信息如问题记录,变动记录,版本信息,状态信息,关系信息等。配置管理流程的 实施有助于通过一种有节制而高效的方式进行IT基础平台变更,并为事件管理,问题管理,改变管理以及其它IT服务过程提供精确的基础数据来源。

Remedy公司的Remedy Asset Management是目前应用较多的一款配置管理软件。它直接支持ITIL兼容的配置管理流程。

Remedy Asset Management可以自动获取企业IT环境(无论是集中式还是分布式)中的配置项目信息,例如硬件的序列号,型号;软件的名称,版本,补丁等综合信息;Remedy Asset Management不仅可以搜集配置项目的基础信息,还可以确定配置项目之间的逻辑关系和物理关系,并记录所有这些信息发生变化的结果以及变化的过程。由于Remedy Asset Management使用数据库详细记录了企业的IT基础设施配置信息,所以对企业的服务人员和管理人员来说,制订相关的报表也就变得非常简单了。

与配置管理有所不同,发布管理的主要目标是在企业范围(无论是集中还是分布环境)中修改,创建和发布新的软件版本,以修正原有版本中存在的一些问题。现代 企业内部的IT系统环境已经越来越复杂,分布的地域也越来越广泛,如何有效的在这种分布式的环境中实施软件的分发和安装是一件日益复杂的工作。一个很简单 的场景,“冲击波”病毒的肆虐让很多企业尝到了苦头。如果企业内所有的PC机上都升级过Windows的补丁,装上了防病毒软件,并适时的更新了病毒列 表,则病毒将没有容身之地。但是,如果企业内有1000台PC,分布在不同的网段,分布在不同的地域,怎样才能实现所有计算机的软件同步升级?在这时候, 一个合适的发布管理软件就将体现出它的价值。

IBM的Tivoli Software Distribution Manager曾是业界最负盛名的软件分发管理软件。现在,在产品中追加更多的先进管理思想和先进软件技术之后,IBM公司推出了IBM Tivoli Configuration Manager。

IBM Tivoli Configuration Manager可以帮助客户全面控制企业的软件和硬件。它的软件分发模块能让用户从一个中心点将复杂的任务关键型应用程序快速有效地部署到多个位置。

利用Tivoli Configuration Manager,客户可以跨越企业部署软件,实现跨平台、企业级库存管理。从产品包装、组织计划到安排发货、设备安装以及总结报告,这款发布管理软件提供 了针对快速、集中应用部署和管理的一整套工具。它是强化桌面支持技术的强大手段,有助于降低客户的资产管理成本。

综合使用配置管理和发布管理工具,并规范其相应的过程,企业可以非常有效的对企业的IT资产的进行管理,维护和升级。

4.1.9 改变管理

在ITIL的定义中,改变管理的主要目标是建立一个标准化的方法和流程,以确保快速和平滑的实现IT环境,IT过程的改变,并确保变化的发生对企业业务所造成的负面影响降低到最小。

改变管理的过程主要是用户提出对IT服务,IT系统的修改要求;管理人员在接收到要求的前提下,检验并批准关于对IT服务,IT系统进行修改的要求,因此 改变管理的软件主要包括对对提出修改要求的跟踪,批准过程的跟踪,对改变所产生的数据发布工作的协调,以及对改变对服务和系统所产生影响的分析。

Remedy公司的Remedy Change Management是目前业界应用比较广泛的改变管理工具。Remedy Change Management提供了对整个改变发生过程的跟踪记录。

在改变提出阶段:Remedy Change Management提供了对改变请求的登记,改变要求的跟踪,以及根据改改变的重要性,优先级,改变的原因,改变影响的范围对改变要求进行分类等等。

在改变批准阶段:Remedy Change Management提供了对改变要求的审核,授权,实施的全程跟踪和辅助,例如它可以提供对改变所需要的人力,物力资源,事件资源的建议和管理。

同时Remedy Change Management还具有对改变所带来的风险,可能产生的后果进行分析的功能。在完成改变的实施以后,用户可以很方便的使用Remedy Change Management来统计改变已经带来的业务影响。

除了Remedy Change Management外,IBM的Rational ClearQuest也是应用改变管理的常用产品。

发表于: 2005-10-01 ,修改于: 2005-10-01 22:35,已浏览673次,有评论0条 推荐 投诉


网友评论

发表评论