4.3 Linux进程管理命令详解(1)
Linux管理进程的最好方法就是使用命令行下的系统命令。Linux下面的进程涉及的命令有at, bg, fg, kill, crontab, jobs, ps, pstree, top, nice, renice, sleep, nohup。
1.at命令:定时运行命令
作用:at命令在指定时刻执行指定的命令序列。
格式:
at [-V] [-q x] [-f file] [-m] time
atq [-V] [-q x]
atrm [-V] [-q x] job…
batch [-V] [-f file] [-m]
|
主要选项如下。
-V:显示作业将被执行的时间。
-q:选用q参数则可选队列名称,队列名称可以是a~z和A~Z之间的任意字母。队列字母顺序越高则队列优先级别越低。
-f:从文件中读取命令或shell脚本,而非在提示后指定它们。
-m:执行完作业后发送电子邮件到用户。
time:设定作业执行的时间。time参数可以是下面格式中的任何一种。
HH:MM格式--如04:00,代表4:00AM。如果时间已过,就会在第二天的这一时间执行。
midnight代表12:00AM。noon代表12:00PM。teatime代表4:00PM。
英文月名日期年份格式--如January 15 2005,代表2005年1月15日。年份可无。
MMDDYY、MM/DD/YY或MM.DD.YY格式--如011505,代表2005年1月15日。
now +时间格式--时间以minutes、hours、days或weeks为单位。如now + 5 days,代表命令应该在5天之后的此时此刻执行。偏移量的格式为时间+偏移量,单位是minutes、hours和days。
说明:at命令实际上是一组命令集合。at命令在指定时刻执行指定的命令序列。atq查询已经设定的命令序列。atrm删除已经设定的命令序列。batch当系统负载低于一个设定值(0.8),执行设定的命令序列。
应用实例如下。
(1)让系统在两天后的17:30执行文件data中指定的作业,使用命令:
#at -f data 15:30 +2 days
|
(2)配置batch作业
要在系统平均载量降到0.8以下时执行某项一次性的任务,使用batch命令。键入batch命令
后,"at>"提示就会出现。键入要执行的命令,按"Enter"键,然后键入"Ctrl-D"。你可以指定多条命令,方法是键入每一条命令后
按"Enter"键。键入所有命令后,按"Enter"键转入一个空行,然后再键入"Ctrl-D"。或者你也可以在提示后输入shell脚本,在脚本的
每一行后按"Enter"键,然后在空行处键入"Ctrl-D"来退出。系统平均载量一降到0.8以下,这组命令或脚本就会被执行。如果这组命令或脚本试
图在标准输出中显示信息,该输出会用电子邮件方式被邮寄给用户。
(3)进阶应用:控制对at和batch的使用
通过/etc/at.allow和/etc/at.deny文件可以用来限制对at和batch命令的使用。这两个
使用控制文件的格式都是每行一个用户。两个文件都不允许使用空白字符。如果控制文件被修改了,at守护进程不必被重启。每次用户试图执行at或batch
命令时,使用控制文件都会被读取。不论控制文件如何规定,超级权限用户总是可以执行at和batch命令。如果at.allow文件存在,只有其中列出的
用户才能使用at或batch命令,at.deny文件会被忽略。如果at.allow文件不存在,所有在at.deny文件中列出的用户都被禁止使用
at和batch命令。
2.bg命令后台运行命令
作用:bg命令使一个被挂起的进程在后台执行。
格式:bg
该命令无参数。
使用说明:Linux作为一个多任务环境,用户会同时执行多项任务,例如,查看系统情况、备份资料、编辑文件和打印文件等。耗时长的任务不应该在前台任务中执行,而应该交给后台任务去执行。这样前台任务可继续正常运作其他的操作,不用等待。
应用实例如下。
(1)如果要将一个大目录的文件进行排序后,将结果输入到一个文件中,可以使用命令:
#du -a / | sort -rn > /tmp/du.sorted
|
(2)由于这个命令执行时间很长,可以把它放在后台运行。使用组合键"Ctrl+Z"。然后使用bg命令。如果想直接把这个命令放在后台执行,可以在命令后使用"&"符号:
#du -a / | sort -rn > /tmp/du.sorted &
[1] 237m32
|
3.Fg挂起程序
作用:fg命令使一个被挂起的进程在前台执行。
格式:fg -[job-spec]
[job-spec]:后台任务号码。
说明:fg命令和bg命令是相对应的。如果想查看后台程序运行情况,可以使用fg命令把它调回前台查看。bg命令可以使多个进程放到后台中执行。
应用实例如下。
使用fg命令时,要加入后台任务号码,如果不加任何号码,则所变动的均是当前任务。
#du -a / | sort -rn > /tmp/du.sorted &
[1] 237
#fg 1
|
4.Jobs显示后台程序
作用:jobs命令显示后台任务的执行情况。
格式:jobs [选项] [jobspec…]
主要选项如下。
-l:长输出格式,显示全部内容。
-n:不输出信息。
-p:只输出进程号。
-r:只输出运行的进程。
[jobspec]:后台任务号码。
应用实例如下。
先把两个进程放在系统后台运行,然后使用jobs命令查看后台任务的执行情况:
#du -a /etc > user.data &
[1] 233
# find / -name core -type f -ls > core.data &
[2] 234
#jobs -l
[1] + 237 Running du -a /etc > user.data
[2] - 238 Running find / -name core -type f -ls > core.data
|
说明:上面的当前任务是"du -a /etc > user.data",因为后台任务号码是"[1]"。当第一个后台任务顺利执行完毕,第二个后台任务还在执行中时,当前任务便会自动变成后台任务号码"[2]"的后台任务。即当前任务是动态的。
5.kill命令杀掉进程
作用:kill命令终止一个进程。
格式:kill [-s signal |-p] [-a]pid…
kill -l [ signal ]
主要选项如下。
-s:指定发送的信号。
-p:模拟发送信号。
-l:指定信号的名称列表。
pid:要终止的进程的ID号。
signal:表示信号。
说明:kill可将指定的信息送至程序。预设的信息为SIGTERM(15),可将指定程序终止。若仍无法终止该程
序,可使用SIGKILL(9)信息尝试强制删除程序。kill命令的工作原理是,向Linux系统的内核发送一个系统操作信号和某个程序的进程标志号,
然后系统内核就可以对进程标志号指定的进程进行操作。当需要中断一个前台进程的时候,通常使用Ctrl+C组合键;但是对于一个后台进程,就不是一个组合
键所能解决的了,这时就必须使用kill命令。
应用实例如下。
命令执行过程如果出错,用户可用"kill"来结束任务。对于在后台运行的进程,可以使用kill命令终止:
#du -a / | sort -rn > /tmp/du.sorted &
[1] 237
#kill 237
|
或者使用命令:
#du -a / | sort -rn > /tmp/du.sorted &
[1] 237
#kill %1
|
对于僵尸进程,可以用kill-9来强制终止退出。
比如一个程序已经彻底死掉,如果kill不加信号强度没有办法退出,最好的办法就是加信号强度-9,后面要接杀父进程;比如;
比如:
[root@localhost ~]# ps aux |grep gaim
beinan 5031 9.0 2.3 104996 17484
S 13:23 0:01 gaim
root 5036 0.0 0.0 5160
724 pts/3 S+ 13:24 0:00 grep gaim
|
kill命令族成员简介如下。
终止一个进程或终止一个正在运行的程序,一般通过kill、killall、pkill、xkill等进行。比如一
个程序已经死掉,但又不能退出,这时就应该考虑应用这些工具。killall通过程序的名字,直接杀死所有进程,pkill和killall的应用方法差
不多,也是直接杀死运行中的程序。如果你想杀掉单个进程,请用kill来杀掉。xkill是在桌面用的杀死图形界面的程序。比如当firefox出现崩溃
不能退出时,点鼠标就能杀死firefox。当xkill运行时出来和个人脑骨的图标,哪个图形程序崩溃,一点就OK了。如果你想终止xkill,就单击
右键取消。
6.crontab命令
作用:crontab命令用于安装、删除或者列出用于驱动cron后台进程的任务表。然后,该配置由cron守护进程在设定的时间执行。
格式:crontab [-u user] 文件
crontab [-u user] { -e | -l | -r }
|
主要选项如下。
-e:执行文字编辑器来设定时程表,默认的文字编辑器是vi。
-r:删除目前的时程表。
-l:列出目前的时程表。
[-u user]:指定要设置的用户名称。
crontab文件的格式是:
minute hour day month dayofweek command
minute--分钟,从0~59之间的任何整数。hour--小时,从0~23之间的任何整数。day--日期,从1~31之间的任何整数(如果指定了
月份,必须是该月份的有效日期)。month--月份,从1~12之间的任何整数(或使用月份的英文简写如jan、feb等)。dayofweek--星
期,从0~7之间的任何整数,这里的0或7代表星期日(或使用星期的英文简写如sun、mon等)。command--要执行的命令(可以是ls之类的命
令,也可以是执行你自行编写的脚本的命令。)
应用实例如下。
设置一个定时、定期的系统提示:
[cao @www cao]#crontab -e
|
此时系统会打开一个vi编辑器,如果我输入"35 17 * * 5 Wall"明天休息,注意备份数据库",然后存盘退出。这时在/var/spool/cron/目录下会生产一个cao的文件,内容如下:
# DO NOT EDIT THIS FILE - edit the master and reinstall.
# (/tmp/crontab.2707 installed on Thu Jan 1 22:01:51 2004)
# (Cron version -- $Id: crontab.
c,v 2.13 1994/01/17 03:20:37 vixie Exp $)
|
35 17 * * 5 wall "明天休息,注意备份数据库 "
这样到每个星期五下班时间(17:35),系统就会弹出一个终端提醒我们注意备份数据库。显示结果如图4-7所示。
|
(点击查看大图)图4-7 一个定时、定期的系统提示
|
7.ps命令查看权限
作用:ps命令主要查看系统中进程的状态。
格式:ps [选项]
主要选项如下。
-A:显示系统中所有进程的信息。
-e:显示所有进程的信息。
-f:显示进程的所有信息。
-l:以长格式显示进程信息。
-r:只显示正在运行的进程。
-u:显示面向用户的格式(包括用户名、CPU及内存使用情况等信息)。
-x:显示所有非控制终端上的进程信息。
-p:显示由进程ID指定的进程的信息。
-t:显示指定终端上的进程的信息。
说明:要对进程进行监测和控制,首先要了解当前进程的情况,也就是需要查看当前进程。ps命令就是最基本、也是非常
强大的进程查看命令。根据显示的信息可以确定哪个进程正在运行、哪个进程被挂起、进程已运行了多久、进程正在使用的资源、进程的相对优先级,以及进程的标
志号(PID)。所有这些信息对用户都很有用,对于系统管理员来说更为重要。使用"ps
-aux"命令可以获得终端上所有用户的有关进程的所有信息,下面结合图4-8讲解进程的基本信息。
图4-8第二行代码中,USER表示启动进程用户。PID表示进程标志号。%CPU表示运行该进程占用CPU的时间
与该进程总的运行时间的比例。%MEM表示该进程占用内存和总内存的比例。VSZ表示占用的虚拟内存大小,以KB为单位。RSS为进程占用的物理内存值,
以KB为单位。TTY表示该进程建立时所对应的终端,"?"表示该进程不占用终端。STAT表示进程的运行状态,包括以下几种代码:D,不可中断的睡
眠;R,就绪(在可运行队列中);S,睡眠;T,被跟踪或停止;Z,终止(僵死)的进程,Z不存在,但暂时无法消除;W,没有足够的内存分页可分
配;<高优先序的进程;N,低优先序的进程;L,有内存分页分配并锁在内存体内(实时系统或I/O)。START为进程开始时间。TIME为执行的
时间。COMMAND是对应的命令名。
|
(点击查看大图)图4-8 ps-aux命令详解
|
应用实例如下。
在进行系统维护时,如果CPU负载突然增加,而又不知道是哪一个进程造成的情况。使用命令:
说明 因为%CPU选项在第三列,所以sort选3作为参数,+表示升序输出结果。
8.pstree命令
pstree命令列出当前的进程,以及它们的树状结构。
格式:pstree [选项] [pid|user]
主要选项如下。
-a:显示执行程序的命令与完整参数。
-c:取消同名程序,合并显示。
-h:对输出结果进行处理,高亮显示正在执行的程序。
-l:长格式显示。
-n:以PID大小排序。
-p:显示PID。
-u:显示UID信息。
-G:使用VT100终端编码显示。
-U:使用UTF-8(Unicode)编码显示。
说明:使用ps命令得到的数据精确,但数据庞大,这一点对掌握系统整体概况来说是不容易的。pstree正好可以弥补这个缺憾。它能将当前的执行程序以树状结构显示。pstree支持指定特定程序(PID)或使用者(USER)作为显示的起始。
应用实例如下。
进程启动的时候可能会产生自己的一个子进程。运行pstree命令就可以很容易地看到这些信息。以超级用户权限运行pstree:
#init-+-apmd
|-atd
|-bdflush
|-gconfd-2
|-gdm-binary---gdm-binary-+-X
| `-startkde-+-kwrapper
| `-ssh-agent
|-gpm
|-httpd---8*[httpd]
……下略
|
命令对程序名称相同的会自动合并,所有"|-httpd---8*[httpd]"即表示系统中有8个httpd进程产生的子进程。
9.top命令显示进程
top命令用来显示系统当前的进程状况。
格式:top [选项]
主要选项如下。
d:指定更新的间隔,以秒计算。
q:没有任何延迟的更新。如果使用者有超级用户,则top命令将会以最高的优先序执行。
c:显示进程完整的路径与名称。
S:累积模式,会将已完成或消失的子进程的CPU时间累积起来。
s:安全模式。
i:不显示任何闲置(Idle)或无用(Zombie)的进程。
n:显示更新的次数,完成后将会退出top。
说明:top命令和ps命令的基本作用是相同的,都显示系统当前的进程状况。但是top是一个动态显示过程,即可以通过用户按键来不断刷新当前状态。这里结合图4-9来说明它给出的信息。
|
(点击查看大图)图4-9 top命令详解
|
在图4-9中,第一行表示的项目依次为当前时间、系统启动时间、当前系统登录用户数目、平均负载。第二行显示的是所
有启动的、目前运行的、挂起(Sleeping)的和无用(Zombie)的进程。第三行显示的是目前CPU的使用情况,包括系统占用的比例、用户使用比
例、闲置(Idle)比例。第四行显示物理内存的使用情况,包括总的可以使用的内存、已用内存、空闲内存、缓冲区占用的内存。第五行显示交换分区的使用情
况,包括总的交换分区、使用的、空闲的和用于高速缓存的交换分区。第六行显示的项目最多,下面列出了详细解释。
PID(Process
ID):进程标志号,是非零正整数。USER:进程所有者的用户名。PR:进程的优先级别。NI:进程的优先级别数值。VIRT:进程占用的虚拟内存值。
RES:进程占用的物理内存值。SHR:进程使用的共享内存值。STAT:进程的状态,其中S表示休眠,R表示正在运行,Z表示僵死状态,N表示该进程优
先值是负数。%CPU:该进程占用的CPU使用率。%MEM:该进程占用的物理内存和总内存的百分比。TIME:该进程启动后占用的总的CPU时间。
COMMAND:进程启动的启动命令名称,如果这一行显示不下,进程会有一个完整的命令行。top命令使用过程中,还可以使用一些交互的命令来完成其他参
数的功能。这些命令是通过快捷键启动的。
<空格>:立刻刷新。
P:根据CPU使用大小进行排序。
T:根据时间、累计时间排序。
q:退出top命令。
m:切换显示内存信息。
t:切换显示进程和CPU状态信息。
c:切换显示命令名称和完整命令行。
M:根据使用内存大小进行排序。
W:将当前设置写入~/.toprc文件中。这是写top配置文件的推荐方法。
可以看到,top命令是一个功能十分强大的监控系统的工具,对于系统管理员而言尤其重要。但是,它的缺点是会消耗很多系统资源。
10.nice命令改变权限优先级
作用:nice命令可以改变程序执行的优先权等级。
格式:nice [-n <优先等级>][--help][--version][命令]
主要选项如下。
-n<优先等级>或-<优先等级>或--adjustment=<优先等级>:设置欲执行的命令的优先权等级。等级的范围从-20~19,其中-20为最高,19为最低。
--help:在线帮助。
说明:应用程序优先权值的范围从-20~19,数字越小,优先权就越高。一般情况下,普通应用程序的优先权值
(CPU使用权值)都是0,如果让常用程序拥有较高的优先权等级,自然启动和运行速度都会快些。需要注意的是普通用户只能在0~19之间调整应用程序的优
先权值,只有超级用户有权调整更高的优先权值(从-20~19)。
应用实例如下。
将ls命令的优先序加1并执行,将结果输入文件1.txt:
11.renice命令修改优先级
作用:renice命令允许用户修改一个正在运行的进程的优先权。
格式:renice priority [ [ -p ] pids ] [ [ -g ] pgrps ] [ [ -u ] users ]
主要选项如下。
priority:优先等级
-p pids:改变该程序的优先权等级,此参数为预设值。
-g pgrps:使用程序群组名称,修改所有隶属于该程序群组的程序的优先权。
-u user:指定用户名称,修改所有隶属于该用户的程序的优先权。
说明:renice命令可重新调整正在执行的程序的优先权等级。默认是以程序识别码指定程序,调整其优先权,也可以
指定程序群组或用户名称调整优先权等级,并修改所有隶属于该程序群组或用户的程序的优先权。等级范围从-20~19,只有超级用户可以改变其他用户程序的
优先权和设置负数等级。普通用户只能对自己所有的进程使用renice命令。
应用实例如下。
将进程PID为987及32的进程与进程拥有者为daemon及root的优先级别号加1:
#renice +1 987 -u daemon root -p 32
|
12.sleep命令暂停进程
作用:sleep命令的功能是使进程暂停执行一段时间。
格式:sleep number [选项]
主要选项如下。
number:时间长度,后面可接s、m、h或d。
s:以秒为单位。
m:以分钟为单位。
h:以小时为单位。
d:以天为单位。
说明:如果没有指定时间,以秒为单位。此命令大多用于shell程序设计中,使两条命令执行之间停顿指定的时间。
应用实例如下。
下面的命令使进程先暂停60秒,然后查看哪个用户登录到系统中:
13.nohup命令用户退出系统之后继续工作
作用:nohup命令确保执行程序能在用户退出系统之后继续工作。
格式:nohup命令
说明:一般退出Linux系统时,会把所有的程序全部结束掉,包括那些后台程序。但有时候,例如,用户正在下载一个
很大的文件,但是你因下班或有事需要先退出系统,希望退出系统时程序还能继续执行。这时,我们就可以使用nohup命令使进程在用户退出后仍继续执行。同
时这些进程都在后台执行(命令放到后台运行,nohup必须与&操作同时使用),结果则会写到用户自己的目录下的nohup.out文件里。
应用实例如下。
程序在后台自动执行:
14.pgrep命令
作用:pgrep命令查找当前运行的进程,并列出匹配给定条件的进程的pid。所有的条件都必须匹配才会被列出。
使用权限:所有用户。
格式:Pgrep [选项][程序名]
选项如下。
-l:列出程序名和进程ID。
-o:进程起始的ID。
-n:进程终止的ID。
应用实例如下。
用户cao查看sshd的进程列表:
[cao@localhost@cao]$pgrep -l sshd
829 sshd
|
15.chkconfig命令设置系统的各种服务
作用:chkconfig命令检查,设置系统的各种服务。
格式:chkconfig [--add][--del][--list][系统服务]
或chkconfig [--level <等级代号>][系统服务][on/off/reset]
主要选项如下。
--add:增加所指定的系统服务,让chkconfig指令得以管理它,并同时在系统启动的叙述文件内增加相关数据。
--del:删除所指定的系统服务,不再由chkconfig指令管理,并同时在系统启动的叙述文件内删除相关数据。
--level<等级代号>:指定读系统服务要在哪一个执行等级中开启或关毕。
说明:chkconfig提供了一个简单的命令行工具用于维护/etc/rc[0-6].d的路径层次,可以帮助系
统管理员在这些路径中直接操作符号行,chkconfig的执行是通过chkconfig命令激发的,此命令目前在irix操作系统中存在。甚至包括了维
护/etc/rc[0-6].d层次之外的设置信息。chkconfig有5个不同的函数:为管理器添加新服务,从管理器中移出服务,列出当前启动的服务
信息,改变服务启动信息,检查特殊服务的启动状态。这是Red
Hat公司遵循GPL规则所开发的程序,它可查询操作系统在每一个执行等级中会执行哪些系统服务,其中包括各类常驻服务。
应用实例如下。
Chkconfig管理服务技巧
如果你使用chkconfig
--list命令,你会看到一个系统服务列表,以及它们在运行级别0~6中已被启动(on)或停止(off)。在列表末端,你会看到由xinetd管理的
服务部分。如果你使用chkconfig--list来查询由xinetd管理的服务,你会看到xinetd服务是被启用(on)还是被关闭(off)
了。例如,命令chkconfig--list finger返回了下列输出:
如上所示,finger作为xinetd服务被启用。如果xinetd在运行,finger就会被启用。
如果你使用chkconfig --list来查询/etc/rc.d中的服务,你会看到服务在每个运行级别中的设置。例如,命令chkconfig --list anacron返回了下列输出:
Anacron 0:off 1:off 2:on 3:on 4:on 5:on 6:off
|
chkconfig还能用来设置某一服务在某一指定的运行级别内被启动还是被停运。例如,要在运行级别3、4、5中停运nscd服务,使用下面的命令:
Chkconfig --level 345 nscd off
|
补充说明:由xinetd管理的服务会立即被chkconfig影响。例如,如果xinetd在运行,finger被禁
用,那么执行了chkconfig finger
on命令后,finger可以自动随xinetd的改变而自动启用。对其他服务的改变在使用chkconfig之后不会立即生效。你必须使用
service daemon
stop命令来停止个别服务。在前面的例子中,把daemon换成你想停止的服务名称,如httpd。把stop换成start或restart来启动或
重新启动该服务。
4.4 总结
进程管理还是需要的,虽然在桌面应用上,我们点鼠标就能完成大多的工作,但在服务器管理中,进程管理还是十分重要
的。以上介绍的Linux下进程管理的命令都是比较重要的,通过这些命令可以对进程进行观察。进程运行需要占用系统资源,一个进程如果占用大量资源会造成
系统性能瓶颈现象。此时就需要进行进程调度,达到实时监控系统和优化性能的目的。
你对每个进程了解得越多,就能够越容易地精确定位进程的问题所在。系统通常会因为某种原因遇到各种问题,比如速度变慢或者不稳定,而使用这些工具可以帮助你提高找到问题所在的能力。