从IPMI 2.0看服务器管理技术的发展趋势
从IPMI 2.0看服务器管理技术的发展趋势
智能平台管理接口(IPMI:Intelligent Platform Management Interface)是一项应用于服务器管理系统设计的标准,由Intel、HP、
Dell和NEC公司于1998年共同提出,当前最新版本为2.0。利用此接口标准设计有助于在不同类服务器系统硬件上实施系统管理,使不同平台的集中管理成为可能。
设计实例凸显IPMI优势
先让我们来看一个IPMI设计的应用实例:一家公司购置了若干台服务器,计划安装不同应用系统分别应用于数据库、网络、打印服务器等。传统实现方式是分别由在某一应用系统有专长的不同系统管理员逐一完成安装、配置及后期维护管理,但利用IPMI管理即可实现统一的管理。以下从安装配置、监控管理、故障诊断三方面来领略一下IPMI带来的优势。
传统的OS安装首先要对服务器的新硬件做驱动,需要相应OS安装手册或专业系统管理员,管理员需要在服务器旁等待整个安装过程完成;而利用IPMI,只需要插入OS自安装光盘即可自动引导安装,在3~4个关键时间点加载新硬件驱动,插入OS安装盘,即可完成OS自动安装,同时还可以利用系统备份工具对重要数据进行备份,方便了故障出现时的系统恢复,极大地节省了时间和人力。
传统的系统监控管理方法一般是系统管理员定期到机房巡视或者采用PCAnywhere 类软件监控,上述方法存在时效性差、服务器宕机后无法追查原因、占用系统资源较多的缺点;IPMI则可实现对服务器系统的实时监控,能够监控网络状态(发现整个网络节点、判断网络节点的在线状态、判断网络的通断、监测网络结点的OS、IP、主机名、网络流量大小等信息);监控服务器系统静态信息(CPU、内存、硬盘、光驱、网卡、显卡、操作系统、RAID卡、PCI附加卡等信息)和动态信息(主板、CPU、SCSI 模组、风扇板等设备的温度、电压、风扇转速信息以及CPU利用率、内存利用率、硬盘I/O访问流量等系统资源信息),还可以实现对RAID阵列的管理;当上述被监控量发生超越门限等异常事件时,监控软件会通过多种形式(消息框、邮件、告警音、短信)告警,同时将告警事件记录入日志,方便管理员根据告警日志分析诊断。对大量分散服务器集中管理的环境应用优势尤为明显。
传统的故障诊断一般是管理员到故障现场根据经验诊断故障原因,而利用IPMI,管理员可以通过网络或者串口访问远端服务器,通过获取事件日志和传感器数据记录来分析、确认故障原因,并通过远程操作来实现服务器恢复。
表象之下的技术
上面我们了解了IPMI带来的优势,那么它是通过何种方式实现这些功能的呢?我们来了解一下表象之下的内容:
在IPMI管理平台中,BMC(Baseboard Management Controller,因为多集成于主板而得名)是核心控制器,系统管理软件对各个被管理器件的管理,都是通过与BMC通信来实现的。
在 IPMB(Intelligent Platform Management Bus)总线上连接着各个管理控制器,分别执行不同功能。IPMB总线上还连接着一些I2C器件,用来作为传感器的接口,让系统管理软件能够通过IPMB 来读取传感器的数据。同时,这些传感器的具体配置信息,如告警门限、事件触发是否允许等配置都保存在一组名为SDR(Sensor Data Record)的数据里面。而传感器产生的告警事件则保存在一组叫做SEL(Sensor Event Log)的数据里面。在IPMB总线上,连接着一个ICMB(Intelligent Chassis Management Bus)桥,通过ICMB可以和远程的另一个管理平台通信。此外,在IPMB总线上,还可以外接其他的用户板,用来扩展IPMI管理平台的功能。
管理系统的核心——BMC芯片就相当于计算机中的中央处理器,通过BMC芯片上一对SMBus接口连接网络,用户可通过网络访问实现对远程服务器接管的带外管理(Out-of-band)功能,例如远程接管服务器(Pre-OS),在客户端实现对远程服务器的完全接管;通过RS-232接口连接Modem,在远程服务器宕机情况下,用户可以通过拨号访问获取SDR、SEL数据,分析诊断故障原因;BMC通过IPMB接口访问模组风扇背板、电源背板等上的 SMC,实现对各种背板的温度电压风扇转速等关键参数管理;BMC通过系统接口(多用SMIC:Server Management Interface Chip),实现IPMI消息传输机制,控制LCD显示和实现上层软件与底层F/W通信,实现告警、数据采集。SDR、SEL、FRU(Field Replacement Unit)物理实体可以是做在芯片内的存储体,也可以是外挂的E2PROM。所有IPMI功能通过向BMC发送命令来完成,命令使用IPMI规范中规定的指令,BMC接收并在系统事件日志中记录事件消息,维护描述系统中传感器情况的传感器数据记录。
IPMI 2.0的新特点
IPMI 2.0是今年2月最新通过的版本,与其前一版本1.5相比,做了多项增强。
SOL(Serial Over Lan)远程管理
PMI 2.0中定义了SOL指令,利用它们可改变IPMI会话过程中本地串口传送数据方向,从而实现对远程服务器的Pre-os访问,提供了通过LAN远程查看、启动、诊断和维修故障的标准方式。
其实现原理为:用户在控制端通过LAN连接远端服务器(控制端需要根据SOL定义指令设计软件来实现监控,远端服务器上BMC硬件连线及底层代码需要根据 SOL定义连线、指令做相应设计),即可在控制端通过安装的软件监控到远端服务器POST整个过程,并可以实现远程接管,进入并修改BIOS设置。远端服务器主板上必须有BMC芯片(或通过外插卡上BMC芯片),BMC芯片和网卡芯片间有SMBus连接,控制台通过网络连接,从BMC获取POST信息。
增强的安全特性
安全问题是任何网络解决方案远程控制都需要考虑的重要因素。IPMI 2.0定义了安全哈希算法-1(SHA-1)和基于密钥哈希消息认证以支持高级认证,给用户安全提供了更高保障;定义了高级加密标准(AES),提供高级加密功能。
对VLAN的支持
VLAN给了系统管理员更多的控制权,加强了系统的安全性。通过在物理LAN上构建一个管理LAN,用户可以保护LAN上的数据不受其他通信的影响,因为在VLAN环境中,只有系统管理员设置的某些控制台可以看见和执行命令。
IPMI 2.0对VLAN的支持为设置管理专用网络提供了方便,并且可以根据管理范围进行配置。这些LAN会话增强的功能加上新定义的有效负载能力(Payload),使多种类型的管理数据流可通过一个LAN会话传送。
未来的技术趋势
国内外监控管理厂商的管理产品多种多样,较为常见的有设备监控管理产品、网络监控管理产品、应用监控管理产品等等,几乎涉及IT 产业的各个领域。从对业界一些管理产品的分析来看,有以下一些发展趋势:
全方位模块化、实时化管理
管理系统模块化趋势明显:设备管理、监控、应用管理与监控、安全风险管理、备份与恢复、快速部署及软件分发、远程控制(KVM)、资产管理、公共基础服务等功能模块跟整个管理系统形成了松耦合关系,用户可以根据自己的实际需求定制适合自己的服务器管理产品。同时远程控制发挥了越来越明显的作用,借助相应的远程控制工具,管理员在远程控制端可以实现像在服务器现场一样的管理,时效性大大增强。
管理技术标准化
优秀的管理产品一般都具有较强的平台无关性和通用性,大多都是按照标准协议进行开发,从底层的数据采集,到中间的通信协议,以及终端的管理应用,都由相关的管理标准所覆盖。IPMI 2.0就是很好的一个管理技术标准。
对被管对象的描述标准化
SNMP 管理协议,被管对象的描述是按照面向过程的方式对被管对象逐一列举;DMI(Desktop Management Interface)对被管对象采用面向对象的描述方式,将被管信息统一组织,并提供一系列接口给管理程序应用;CIM(Common Information Model)使得管理对象、被管信息和访问方式完全面向对象化。
CIM 是DMTF(Desktop Management Task Force)提出的通用信息管理模型。它以面向对象的方式对系统管理的不同问题域进行描述,使得不同管理系统和应用之间能够共享和交换管理信息。它由两部分构成: CIM 规范(CIM Specification)描述了建模语言、命名规则、元模式以及与其他管理信息模型(SNMP 的MIBs ,DMTF 的MIFs 等)之间的映射(Mapping);CIM 模式(CIM Schema)提供了实际的管理信息模型描述,同时还提供了一整套类(Class)用以组织计算环境中的各种管理信息。
目前,在对网络设备的管理中,标准CIM 模型采用得越来越多,从设备监控、安全监控、存储管理等各个方面都有产品应用。这也是下一代服务器管理产品的应用趋势。
管理方式逐步向分布式发展
传统的管理产品一般是M/A架构,一个管理中心和多个被管设备之间进行独立点对点通信,被管设备之间没有任何联系,限制了网络资源的共享和使用,而且对管理员的管理方式也有限定。随着管理系统的发展,被管设备之间的联系会逐步加强,不但管理中心可控制访问被管设备资源,被管设备之间也可以实现资源共享。
IPMI V2.0简化服务器管理
出处:网络世界 | 2006-2-25 1:18:50 |
IPMI规范2.0版目前在许多机架式服务器和刀片计算平台上得到支持。具有IPMI功能的服务器使网络管理人员可以访问与监测服务器硬件,诊断被冻结的服务器并让它恢复正常运行。 IPMI定义了用于接口连接嵌入在服务器平台中的一种服务处理器的协议。这种服务处理器叫做基板管理控制器(BMC),BMC安装在服务器主板上或刀片服务器、电信平台的机架上。BMC通过串行总线连接到主处理器以及其他板上器件。
服务处理器监测板上测试仪器(如温度传感器、CPU状态、风扇速度和电压传感器),提供重新引导服务器的远程电源控制功能,并且提供对BIOS配置和操作系统控制台信息的远程访问。由于BMC是独立的处理器,因此该系统不管主处理器是否运行都发挥作用。管理人员利用加载在桌面系统上的IPMI兼容管理应用程序,或通过一台内含IPMI管理固件的带外设备上的Web界面远程访问BMC。
在正常运行时,IPMI使服务器操作系统获得有关系统健康状况的信息并控制系统硬件。例如,IPMI可以监测传感器,进行主动的问题检测。如果服务器温度上升到规定的水平以上,服务器操作系统可以指挥BMC提高风扇速度或降低处理器速度来解决问题。 IPMI还可以带外运行,使外部代理可以监测系统健康状况和控制硬件状态。 IPMI规范2.0版支持LAN上串行(Serial over LAN),将串行控制台功能通过IP提供给IPMI。管理人员可以完全远程访问基于文本的系统信息以及控制BIOS、实用程序、操作系统和应用程序。 IPMI 2.0还大大加强了一些重要的安全特性:对增强型认证的支持提供建立安全远程会话和认证用户的更可靠的过程;对增强型加密的支持通过LAN上串行提供安全远程口令配置和保护任意传输过程中的敏感系统数据;一个固件防火墙防止执行可能让系统面临风险的预先定义的活动的命令集合。
尽管有了这些改进,但许多企业仍没有使用IPMI功能,阻碍广泛采用IPMI的一个关键因素是它缺少对企业安全协议的支持。下一个IPMI版本很可能将包括对企业安全性的支持。不管怎样,IPMI 2.0版都为我们提供了减少IT基础设施管理的费用和复杂性的途径。
IPMI 跨入“二”字头——IPMI V2.0工作原理详解
出处:网络世界 | 2006-2-25 1:15:48
——IPMI V2.0工作原理详解
高性能、可靠的系统常常存在一个缺点:它们通常是利用具有很少或没有互操作性的专有部件生产的。过去,服务器管理依赖于专有工具,而专有工具管理多厂商服务器机柜和刀片服务器非常困难。人们需要一项标准将不同的东西整合在一起,这项标准就是“智能平台管理接口”(IPMI)。
服务器厂商从1998年起就开发了用于跨平台系统管理的IPMI标准,目前有160多家厂商采用了IPMI 1.5。这项标准的最新版本——IPMI 2.0在今年2月宣布推出。与1.5版相比,2.0版最值得注意的增强功能是更强的安全性和标准化的控制台访问。
IPMI的核心是一个专用芯片/控制器(叫做服务器处理器或基板管理控制器(BMC))。这个控制器一般安装在系统主板或刀片上。IPMI固件与BMC一起构成了独立平台管理子系统的基础。这个子系统工作时不管处理器、BIOS或操作系统的类型或状态如何,都能提供可管理性和监测功能,甚至在系统其余部分不能使用时仍能执行恢复操作。
所有的IPMI功能都是向BMC发送命令来完成的,命令使用IPMI规范中规定的指令,BMC接收并在系统事件日志中记录事件消息,维护描述系统中传感器情况的传感器数据记录。
在需要远程访问系统时,IPMI新的LAN上串行(SOL)特性很有用。SOL改变IPMI会话过程中本地串口传送方向,从而提供对紧急管理服务、 Windows专用管理控制台或Linux串行控制台的远程访问。BMC通过在LAN上改变传送给串行端口的信息的方向来做到这点,提供了一种与厂商无关的远程查看启动、操作系统加载器或紧急管理控制台来诊断和维修故障的标准方式。
新用户登录、安全配置选项使IPMI安全性和性能配置方面可满足特殊的需要。这些LAN会话增强功能加上新的有效负载能力,使多种类型的管理数据流(如加密或未加密的IPMI和SOL)可通过一个LAN会话传送。
IPMI增强的认证(基于安全哈希算法1和基于密钥哈希消息认证)和加密(高级加密标准和Arcfour)功能有助于实现安全的远程操作。对VLAN的支持为设置管理专用网络提供了方便,并且可以以通道为基础进行配置。
硬件厂商可利用更灵活的设备选择来实现IPMI 2.0。模块化的扩展加强了更换刀片的能力,而固件防火墙则支持模块化系统中刀片之间的分区和管理保护。(美国《Network World》供本报专稿)
阅读(1067) | 评论(0) | 转发(0) |