分类:
2020-07-02 11:23:07
原文地址:Solaris 10 SMF 作者:东方蜘蛛
Solaris 10引入全新的后台服务管理机制,该机制被称为SMF,它包含了新的概念、管理工具和服务定义方式。比如用里程碑(milestone)代替了运行级别的概念;用服务配置库代替分散在/etc/rcx.d目录的服务启动脚本。
SMF相对于传统的Unix后台服务管理机制具备以下突出的功能:
1. 恢复由软件故障、硬件故障、管理错误终止的服务
2. 服务之间可以定义依赖关系
3. 服务可以有多个实例
3. 提供了比较全面基于命令行管理工具
4. 根据依赖关系可以并发启动服务,加快系统启动的速度
5. 引入服务配置库,提供服务配置库快照、备份、恢复功能
这些功能方便了服务的管理,服务的可用性。SMF提供了一定程度的服务自愈性,它也是Solaris 10系统可预测自愈功能(Predictive Self-Healing)的一部分。
SMF组成要素
SMF包含两个进程、服务定义的manifest和profile、服务配置库和命令行管理工具等内容:
1. svc.startd, svc.configd
2. manifest, profile
3. repository(sqlite db)
4. CLI mgmt tool (svccfg, svcadm, svcprop, svcs, inetadm, inetconv, repoistory_restore)
svc.startd是SMF的主要进程,它根据系统管理员指令或者系统故障或应用故障来启动、停止、重启服务。
svc.configd是负责管理服务配置库的进程。SMF命令行工具svccfg, svcprop, svcs, svcadm通过该进程访问服务配置库。
服务和服务的实例可以用xml文件定义,manifest定义服务,profile定义服务实例,这些xml文件通常存放在/var/svc目录下。
服务配置库存放在/etc/svc/repository.db文件中。服务配置库实际上是一个sqlite的关系数据库,它存放了服务的定义、配置等信息。
/var/svc目录下的manifest和profile文件和/etc/svc/repository.db文件都包含了服务的定义、配置等信息,后者的信息是权威的。
使用svccfg import命令可将SMF服务的manifest xml文件导入到repository中;
使用svccfg export命令可将repository中SMF服务的manifest信息导出到xml文件;
使用svccfg apply命令可将SMF服务的profile xml文件导入到repository中;
使用svccfg etract命令可将repository中SMF服务的profile信息导出到xml文件。
SMF中的服务
服务和服务实例
SMF中的服务可以有多个实例,服务实例继承服务的属性。
SMF中的服务命名
SMF中的服务命名方式和传统的Unix中的后台进程的命名方式有很大的差别,SMF服务名称是用FMRI(Fault Managed Resouce Identifier)表示的,FMRI是基于URI规范资源命名方式在Solaris系统的一个应用。对于SMF服务,其格式是:
scheme:/category1/category2.../categoryn/service[:instance]
scheme有svc和lrc,lrc没有实例名。
svc模式的FMRI表示SMF服务,而lrc模式的FMRI表示旧的基于rc脚本的服务。
用svcs -a可以列出当前所有的服务:
STATE STIME FMRI
legacy_run 1:58:26 lrc:/etc/rcS_d/S50sk98sol
legacy_run 1:58:50 lrc:/etc/rc3_d/S50apache
legacy_run 1:58:51 lrc:/etc/rc3_d/S75seaport
legacy_run 1:58:55 lrc:/etc/rc3_d/S76snmpdx
legacy_run 1:58:57 lrc:/etc/rc3_d/S90samba
...
disabled 1:58:06 svc:/network/iscsi_initiator:default
disabled 1:58:06 svc:/system/metainit:default
disabled 1:58:07 svc:/network/ipfilter:default
disabled 1:58:08 svc:/network/rpc/keyserv:default
disabled 1:58:08 svc:/network/rpc/nisplus:default
disabled 1:58:08 svc:/network/nis/client:default
disabled 1:58:08 svc:/network/dns/client:default
disabled 1:58:08 svc:/network/ldap/client:default
disabled 1:58:09 svc:/network/nfs/cbd:default
disabled 1:58:09 svc:/network/nfs/mapid:default
...
online 1:58:06 svc:/system/svc/restarter:default
online 1:58:08 svc:/network/pfil:default
online 1:58:10 svc:/network/loopback:default
online 1:58:11 svc:/milestone/name-services:default
online 1:58:12 svc:/system/filesystem/root:default
online 1:58:14 svc:/system/boot-archive:default
online 1:58:15 svc:/network/physical:default
online 1:58:15 svc:/milestone/network:default
online 1:58:20 svc:/application/print/cleanup:default
online 1:58:21 svc:/system/picl:default
online 1:58:21 svc:/system/sysevent:default
online 1:58:21 svc:/system/device/fc-fabric:default
online 1:58:22 svc:/milestone/devices:default
online 1:58:28 svc:/system/sysidtool:net
online 1:58:30 svc:/system/sysidtool:system
online 1:58:30 svc:/network/nfs/status:default
online 1:58:45 svc:/network/ssh:default
...
第三列FMRI就是服务名称。上述输出中显示了在Solaris 10中捆绑的Samba、Apache 1.3.x服务名称,由于它们仍然沿用了rc脚本的启动方式,所以它们的名称是以lrc开头的,这类服务无法用svcadm来管理。比如试图运行命令svcadm enable lrc:/etc/rc3_d/S90samba,系统会报错。上述输出中显示了ssh服务的服务名为svc:/network/ssh:default。
用FMRI表示的服务名称可以唯一地标识一个服务,但是名称通常都比较冗长,不便记忆。所以SMF允许服务名称的缩写,只要可以唯一标识服务,scheme,instance,category都可以省。所以ssh服务的名称可以简写成ssh。简写的服务名在SMF的命令行工具中都可以使用。
使用FMRI方法命名服务后使得原先的服务名称发生了变化,但通过以下方法可以找SMF服务的名称
1. 猜测法,根据该服务的关键词得一个可能的服务名(guess_service_name),如Apache web服务可以用apache,NFS文件服务可以用nfs。 然后用svcs -a |grep guess_service_name。
2. 查看该服务所属应用的文档。
以下是常见服务的名称
服务 最简缩写 FMRI
sshd ssh svc:/network/ssh:default
cron cron svc:/system/cron:default
automount autofs svc:/system/filesystem/autofs:default
Apache2 apache2 svc:/system/filesystem/autofs:default
sendmail sendmail svc:/network/smtp:sendmail
nfs nfs/server svc:/network/nfs/server:default
管理SMF服务
管理SMF服务包括配置、查看、启用/禁用、启动/停止服务等任务。这些任务分别可以用svccfg, svcs, svcadm命令完成。
svccfg命令
svccfg命令用来管理SMF repository。运行不带参数的svccfg命令进入一个交互式的shell,在该shell里可以对服务、服务实例进行配置、导入、导出、备份、恢复操作。
#TODO:增加使用svccfg shell的例子。
最常用的操作是新增一个SMF服务时导入该服务的manifest文件,可以使用svccfg import
-bash-3.00# svccfg -v import postfix.xml
svccfg: couldn't parse document
会报无法解析文档的错误。因此,编写完manifest xml文件应当验证一下文件的有效性。
svcs命令
svcs用于查看服务的状态,
svcs -a用于查看所有状态的服务
svcs -x用于查看未正常启动的服务
svcs -l
svcadm命令
svcadm用来启用/禁用、启动/停止SMF服务。
svcadm enable fmri -- 启用一个SMF服务,同时运行该服务
svcadm disable fmri -- 禁用一个SMF服务,同时停止该服务
svcadm restart fmri -- 重启一个SMF服务
svcadm refresh fmri -- 刷新一个SMF服务,相当于让服务重新载入配置文件
svcadm mark fmri -- 将SMF服务标记为维护状态
svcadm clear fmri -- 清除SMF服务的维护状态
svcadm milestone milestone -- 进入指定的服务里程碑,相当于进入相应的运行级别
如果不指定参数,svcadm将输出该命令的使用方法。
如:
-bash-3.00# svcadm
Usage: svcadm [-v] [cmd [args ... ]]
svcadm enable [-rst]
svcadm disable [-st]
svcadm restart
svcadm refresh
svcadm mark [-It]
svcadm clear
svcadm milestone [-d]
Services can be specified using an FMRI, abbreviation, or fnmatch(5)
pattern, as shown in these examples for svc:/network/smtp:sendmail
svcadm
svcadm
svcadm
svcadm
svcadm
svcadm
svcadm
SMF
使用svcs -xv可以查找未正常启动的服务。SMF对每个服务实例都在/var/svc/log目录创建了一个和服务FMRI对应的日志文件,比如apache2服务的FMRI为svc:/network/http:apache2,那么apache2服务状态变化的日志存放在名为network-http:apache2.log的文件中,
如运行以下命令
-bash-3.00# ls -l /var/svc/log |grep network
-rw-r--r-- 1 root root 534 Feb 9 00:08 milestone-network:default.log
-rw-r--r-- 1 root root 77 Jan 30 15:25 network-dns-client:default.log
-rw-r--r-- 1 root root 169 Jan 30 15:27 network-dns-server:default.log
-rw-r--r-- 1 root root 803 Feb 13 01:17 network-http:apache2.log
-rw-r--r-- 1 root root 2843 Jan 30 15:30 network-inetd-upgrade:default.log
-rw-r--r-- 1 root root 2929 Feb 12 01:58 network-inetd:default.log
-rw-r--r-- 1 root root 2835 Feb 12 01:58 network-initial:default.log
-rw-r--r-- 1 root root 77 Jan 30 15:25 network-ipfilter:default.log
-rw-r--r-- 1 root root 77 Jan 30 15:25 network-iscsi_initiator:default.log
输出的第四行列出了apache2服务的日志文件名。通过查看这些文件可以获得服务未正常启动的线索。
SMF中的inetd服务
SMF包含了对inetd服务管理,除了标准的svccfg, svcadm, svcs命令外,SMF还提供了inetadm和inetconv专门管理inetd服务。inetadm命令用来查看、启用/禁用、修改inetd服务,inetconv则是用来将旧的inetd服务配置转化成SMF规范的服务。常用的inetadm选项如下
inetadm -e fmri 启用指定的inetd服务
inetadm -d fmri 禁用指定的inetd服务
inetadm -l fmri 列出指定inetd服务的属性
inetadm -p 列出默认inetd服务的属性
如果不指定参数inetadm将列出当前系统所有的inetd服务。如:
-bash-3.00# inetadm
ENABLED STATE FMRI
enabled online svc:/application/x11/xfs:default
enabled online svc:/application/font/stfsloader:default
enabled offline svc:/application/print/rfc1179:default
enabled online svc:/network/rpc/mdcomm:default
enabled online svc:/network/rpc/meta:default
enabled online svc:/network/rpc/metamed:default
enabled online svc:/network/rpc/metamh:default
enabled online svc:/network/rpc/gss:default
disabled disabled svc:/network/rpc/ocfserv:default
enabled online svc:/network/rpc/smserver:default
disabled disabled svc:/network/rpc/rex:default
enabled online svc:/network/rpc/rstat:default
enabled online svc:/network/rpc/rusers:default
disabled disabled svc:/network/rpc/spray:default
...
查看telnet服务的状态:
-bash-3.00# inetadm |grep telnet
enabled online svc:/network/telnet:default
禁用telnet服务
-bash-3.00# inetadm -d telnet
查看telnet服务的状态:
-bash-3.00# inetadm |grep telnet
disabled disabled svc:/network/telnet:default
SMF兼容旧的rc机制,solaris 10 2006 update 1版本中有些服务仍然使用了旧的rc机制,以运行级别三的服务为例,尚有以下服务未使用SMF:
-bash-3.00# ls -l /etc/rc3.d
total 30
-rw-r--r-- 1 root sys 1285 Jan 22 2005 README
-rwxr--r-- 6 root sys 474 Jan 22 2005 S16boot.server
-rwxr--r-- 6 root sys 1649 Jan 8 2005 S50apache
-rwxr-xr-x 1 root sys 491 Jan 8 2005 S75seaport
-rwxr--r-- 6 root sys 685 Jan 22 2005 S76snmpdx
-rwxr--r-- 6 root sys 1125 Jan 22 2005 S77dmi
-rwxr--r-- 6 root sys 512 Jan 22 2005 S81volmgt
-rwxr-xr-x 5 root sys 2225 Jan 8 2005 S82initsma
-rwxr--r-- 5 root sys 824 May 27 2004 S84appserv
-rwxr--r-- 6 root sys 324 Apr 20 2005 S90samba
其中S90samba,S50apache,S84appserv的存在表明Samba, Apache, Sun Application Server服务已启用。
总结
SMF提供了一个健壮的、可管理的后台服务管理机制,它使系统管理更为方便。在下一篇里作者将结合实例讨论将创建SMF服务的方法和步骤。
相关的手册
smf(5), svcadm(
相关的文件和目录
/etc/svc -- 存放SMF服务配置库
/var/svc/manifest -- 存放SMF服务manifest xml文件
/var/svc/profile -- 存放SMF服务profile xml文件
/var/svc/log -- 存放SMF服务状态变化日志
/lib/svc/method -- 存放SMF服务启动脚本
/lib/svc/seed -- 存放SMF服务配置库的出厂设置
参考信息
SMF快速入门
面向开发者的SMF介绍
http://www.sun.com/bigadmin/content/selfheal/sdev_intro.html
配置JBoss为SMF服务的例子
配置Postfix为SMF服务的例子
Solaris管理员手册:
System Administration Guide: Basic Administration Chapter 14 Managing Services (Overview),Chapter 15 Managing Services (Tasks)
新增SMF服务
在Solaris 10中创建SMF服务的步骤
1. 编写启动脚本
2. 编写manifest, profile
3. 导入到服务库中, svcadm import your_manifest.xml
服务定义:profile+manifest
SMF服务用XML文件定义。一种方式是先定义服务名称、启动/停止方法、依赖关系、属性等成为mainfest的信息,然后定义服务的实例profile。这种方式主要为了支持多实例的服务。另外一种是只定义manifest,这方便了那些单实例服务的定义。manifest和profile的文件的DTD相同,该DTD在Solaris系统的/usr/share/lib/xml/dtd/service_bundle.dtd.1文件中描述。
定义manifest
定义SMF服务manifest需要编写一个xml文件,大致结构是
type='service'
version='1'>
name='start'
exec='/lib/svc/method/sshd start'
timeout_seconds='60'/>
service_bundle是根元素,type='manifest'表示该文件定义manifest,type='profile'则表示该文件定义profile,name属性的值应该和该服务软件包名称一致。 service_bundle可以包含一个或多个service元素,因此可以在一个manifest文件中定义多个服务。但为了便于维护不相关的服务通常定义在不同的文件中。service元素用来定义服务。type属性值应该为service。name属性是该服务的名称,不能和其它服务名重复。dependency用来定义该服务依赖其它服务;exec_method是该服务启动/停止/刷新时需要执行的方法;property_group定义服务的扩展属性;template主要提供该服务描述简要描述,其文档的链接或使用手册。
#TODO: add ssh manifest as exmaple
定义profile
定义profile相对简单,通常都只是在manifest的基础上定义服务的实例。大致结构如下:
服务profile定义同样以service_bundle元素为根元素,其type属性的值固定为"profile"。需要定义实例的服务用service元素表示,并名称、版本、类型要和manifest中定义的一致。服务实例在service元素的instance子元素定义。一个服务可以定义多个实例。instance元素中可以重新定义dependency,exec_method,property_group,template来覆盖manifest中该服务的设置。通常只需要定义实例名称和是否需要启用即可。
#TODO: add ssh profile as exmaple
依赖关系:
SMF中服务支持依赖关系,在服务的manifest文件中service元素的子元素dependency用来定义依赖。大致结构如下:
restart_on='none|error|restart|refresh'
type='service|path'>
该元素的name属性定义该依赖的名称,type属性值为service表示该服务依赖于其它服务是否运行,值为path则表示依赖某个文件是否存在。grouping属性表示该服务有多依赖情形时依赖满足的规则。require_all表示该组依赖都必须满足;require_any表示该服务的诸多依赖中至少有一个满足;optional_all表示依赖是可选的;exclude_all表示服务的依赖不满足时满足。服务运行后,如果它所依赖的服务终止或刷新,那么SMF将根据导致这个状态改变的原因(通常是软硬件故障和软硬件故障)和restart_on属性的值来决定该服务本身是否需停止或重启。其规则如下表
| restart_on的值
事件 | none error restart refresh
-------------------+------------------------------
软硬件故障 | 否 是 是 是
非故障终止 | 否 否 是 是
刷新 | 否 否 否 是
简单地说,如果restart_on为none则不管什么原因引起的所依赖服务终止、刷新都不会终止或刷新服务本身;如果restart_on为error则仅当软硬件故障原因引起的所依赖服务终止、刷新都才会终止或刷新服务本身;如果restart_on为restart则软硬件故障或非故障终止都会终止或刷新服务本身;如果restart_on为refresh则不管什么原因引起的所依赖服务终止或刷新都会终止或刷新服务本身;
smf对旧的rc机制的支持,(以solaris 10 update 1为实例说明)
在Solaris 10中增加smf服务的步骤
1. 编写启动脚本
2. 编写manifest, profile
3. 导入到服务库中, svcadm import your_manifest.xml
总结:smf优点
smf和传统的后台进程运行机制的比较
运行级别<-> milestone
服务的依赖关系,旧机制通过安排服务启动顺序进行有限的支持,smf可以显式地定义服务的依赖关系
相关的手册
smf(5)
相关的文件和目录
/etc/svc/*; /var/svc/*; /lib/svc/*
参考信息
SMF快速入门
面向开发者的SMF介绍
http://www.sun.com/bigadmin/content/selfheal/sdev_intro.html
配置JBoss为SMF服务的例子
配置Postfix为SMF服务的例子
Solaris管理员手册:
System Administration Guide: Basic Administration Chapter 14 Managing Services (Overview),Chapter 15 Managing Services (Tasks)