分类: LINUX
2010-09-27 14:41:35
2008 年 10 月 20 日
Linux® kernel 2.6.25 引入了一种新的进程状态,名为TASK_KILLABLE
,用于将进程置为睡眠状态,它可以替代有效但可能无法终止的TASK_UNINTERRUPTIBLE
进程状态,以及易于唤醒但更加安全的TASK_INTERRUPTIBLE
进程状态。2002 年,OpenAFS 文件系统驱动程序在阻塞所有信号之后等待事件中断时遇到了问题,而TASK_KILLABLE
就是因此而被推出的。这种新的睡眠状态允许TASK_UNINTERRUPTIBLE
响应致命信号。在本文中,作者将介绍这方面的内容,并结合 2.6.26 和早期版本 2.6.18 中的示例来讨论 Linux 内核发生的相关变化以及这些变化带来的新 API。
类似于文件,进程是任何 UNIX® 操作系统的基本元素。进程是执行可执行文件的指令的动态实体。除了执行其指令之外,进程有时还会管理 打开文件、处理器上下文、地址空间以及与程序相关的数据等。Linux 内核将关于进程的完整信息保存在进程描述符 中,它的结构被定义为 struct task_struct
。您可以在 Linux 内核源文件 include/linux/sched.h 中看到 struct task_struct
的各个字段。
在进程的生命周期内,可能会经历一系列互斥的状态。内核将进程的状态信息保存在 struct task_struct
的 state 字段中。图 1 展示了进程状态之间的转换。
我们先来了解一下各种进程状态:
TASK_RUNNING
:进程当前正在运行,或者正在运行队列中等待调度。
TASK_INTERRUPTIBLE
:进程处于睡眠状态,正在等待某些事件发生。进程可以被信号中断。接收到信号或被显式的唤醒呼叫唤醒之后,进程将转变为 TASK_RUNNING
状态。
TASK_UNINTERRUPTIBLE
:此进程状态类似于 TASK_INTERRUPTIBLE
,只是它不会处理信号。中断处于这种状态的进程是不合适的,因为它可能正在完成某些重要的任务。 当它所等待的事件发生时,进程将被显式的唤醒呼叫唤醒。
TASK_STOPPED
:进程已中止执行,它没有运行,并且不能运行。接收到 SIGSTOP
和 SIGTSTP
等信号时,进程将进入这种状态。接收到 SIGCONT
信号之后,进程将再次变得可运行。
TASK_TRACED
:正被调试程序等其他进程监控时,进程将进入这种状态。
EXIT_ZOMBIE
:进程已终止,它正等待其父进程收集关于它的一些统计信息。
EXIT_DEAD
:最终状态(正如其名)。将进程从系统中删除时,它将进入此状态,因为其父进程已经通过 wait4()
或 waitpid()
调用收集了所有统计信息。 有关进程状态转换的详细信息,请参阅 一节中的 UNIX 操作系统设计。
如前所述,进程状态 TASK_UNINTERRUPTIBLE
和 TASK_INTERRUPTIBLE
都是睡眠状态。现在,我们来看看内核如何将进程置为睡眠状态。
Linux 内核提供了两种方法将进程置为睡眠状态。
将进程置为睡眠状态的普通方法是将进程状态设置为 TASK_INTERRUPTIBLE
或 TASK_UNINTERRUPTIBLE
并调用调度程序的 schedule()
函数。这样会将进程从 CPU 运行队列中移除。如果进程处于可中断模式的睡眠状态(通过将其状态设置为 TASK_INTERRUPTIBLE
),那么可以通过显式的唤醒呼叫(wakeup_process()
)或需要处理的信号来唤醒它。
但是,如果进程处于非可中断模式的睡眠状态(通过将其状态设置为 TASK_UNINTERRUPTIBLE
),那么只能通过显式的唤醒呼叫将其唤醒。除非万不得已,否则我们建议您将进程置为可中断睡眠模式,而不是不可中断睡眠模式(比如说在设备 I/O 期间,处理信号非常困难时)。
当处于可中断睡眠模式的任务接收到信号时,它需要处理该信号(除非它已被屏弊),离开之前正在处理的任务(此处需要清除代码),并将 -EINTR
返回给用户空间。再一次,检查这些返回代码和采取适当操作的工作将由程序员完成。因此,懒惰的程序员可能比较喜欢将进程置为不可中断模式的睡眠状态,因为信号不会唤醒这类任务。但需要注意的一种情况是,对不可中断睡眠模式的进程的唤醒呼叫可能会由于某些原因不会发生,这会使进程无法被终止,从而最终引发问题,因为惟一的解决方法就是重启系统。一方面,您需要考虑一些细节,因为不这样做会在内核端和用户端引入 bug。另一方面,您可能会生成永远不会停止的进程(被阻塞且无法终止的进程)。
现在,我们在内核中实现了一种新的睡眠方法!
Linux Kernel 2.6.25 引入了一种新的进程睡眠状态,TASK_KILLABLE
:当进程处于这种可以终止的新睡眠状态中,它的运行原理类似于 TASK_UNINTERRUPTIBLE
,只不过可以响应致命信号。清单 1 给出了内核 2.6.18 与内核 2.6.26 进程状态(定义在 include/linux/sched.h 中)之间的比较:
Linux Kernel 2.6.18 Linux Kernel 2.6.26
================================= ===================================
#define TASK_RUNNING 0 #define TASK_RUNNING 0
#define TASK_INTERRUPTIBLE 1 #define TASK_INTERRUPTIBLE 1
#define TASK_UNINTERRUPTIBLE 2 #define TASK_UNINTERRUPTIBLE 2
#define TASK_STOPPED 4 #define __TASK_STOPPED 4
#define TASK_TRACED 8 #define __TASK_TRACED 8
/* in tsk->exit_state */ /* in tsk->exit_state */
#define EXIT_ZOMBIE 16 #define EXIT_ZOMBIE 16
#define EXIT_DEAD 32 #define EXIT_DEAD 32
/* in tsk->state again */ /* in tsk->state again */
#define TASK_NONINTERACTIVE 64 #define TASK_DEAD 64
#define TASK_WAKEKILL 128
|
注意,状态 TASK_INTERRUPTIBLE
和 TASK_UNINTERRUPTIBLE
并未修改。 TASK_WAKEKILL
用于在接收到致命信号时唤醒进程。
清单 2 展示了状态 TASK_STOPPED
和 TASK_TRACED
的修改之处(以及 TASK_KILLABLE
的定义):
#define TASK_KILLABLE (TASK_WAKEKILL | TASK_UNINTERRUPTIBLE) #define TASK_STOPPED (TASK_WAKEKILL | __TASK_STOPPED) #define TASK_TRACED (TASK_WAKEKILL | __TASK_TRACED) |
换句话说,TASK_UNINTERRUPTIBLE
+ TASK_WAKEKILL
= TASK_KILLABLE
。
|
让我们来看看这种新状态中的新函数。
int wait_event_killable(wait_queue_t queue, condition);
queue
中,直到 condition
等于 true。
long schedule_timeout_killable(signed long timeout);
TASK_KILLABLE
并调用 schedule_timeout()
,它用于让调用任务睡眠 timeout
个 jiffies。(在 UNIX 系统中,jiffy 主要表示两个连续时钟计时单元之间的时间。
int wait_for_completion_killable(struct completion *comp);
schedule_timeout()
维持 MAX_SCHEDULE_TIMEOUT
(指定为等于 LONG_MAX
)个 jiffies 时间。
int mutex_lock_killable(struct mutex *lock);
int down_killable(struct semaphore *sem);
sem
。如果信号量不可用,它将被置为睡眠状态;如果向它传递了一个致命信号,则会将它从等待者列表中删除,并且需要响应此信号。获取信号量的另外两种方法是使用例程 down()
或 down_interruptible()
。down()
函数现在已不建议使用。您应该使用 down_killable()
或 down_interruptible()
函数。
NFS 客户机代码也使用了这种新进程状态。清单 3 显示了 Linux 内核 2.6.18 和 2.6.26 在 nfs_wait_event
宏方面的差异。
Linux Kernel 2.6.18 Linux Kernel 2.6.26 ========================================== ============================================= #define nfs_wait_event(clnt, wq, condition) #define nfs_wait_event(clnt, wq, condition) ({ ({ int __retval = 0; int __retval = wait_event_killable(wq, condition); if (clnt->cl_intr) { __retval; sigset_t oldmask; }) rpc_clnt_sigmask(clnt, &oldmask); __retval = wait_event_interruptible(wq, condition); rpc_clnt_sigunmask(clnt, &oldmask); } else wait_event(wq, condition); __retval; }) |
清单 4 显示了 nfs_direct_wait()
函数在 Linux Kernels 2.6.18 与 2.6.26 中的定义
Linux Kernel 2.6.18 ================================= static ssize_t nfs_direct_wait(struct nfs_direct_req *dreq) { ssize_t result = -EIOCBQUEUED; /* Async requests don't wait here */ if (dreq->iocb) goto out; result = wait_for_completion_interruptible(&dreq->completion); if (!result) result = dreq->error; if (!result) result = dreq->count; out: kref_put(&dreq->kref, nfs_direct_req_release); return (ssize_t) result; } Linux Kernel 2.6.26 ===================== static ssize_t nfs_direct_wait(struct nfs_direct_req *dreq) { ssize_t result = -EIOCBQUEUED; /* Async requests don't wait here */ if (dreq->iocb) goto out; result = wait_for_completion_killable(&dreq->completion); if (!result) result = dreq->error; if (!result) result = dreq->count; out: return (ssize_t) result; } |
要了解 NFS 客户机中的更多变化,以便于更好地掌握这种新功能,请参阅 一节中的 Linux Kernel Mailing List 条目。
早期的 NFS 挂载选项 intr
可以帮助解决 NFS 客户机进程中断并等待某些事件的问题,但它允许所有中断,而不仅仅是通过致命信号(如 TASK_KILLABLE
)。
尽管此特性是对现有选项的改进 — 毕竟,它是解决死进程的另一种方法 — 但它要得到普遍应用还有待时日。记住,除非真的非常有必要 禁止显式唤醒呼叫(通过传统的 TASK_UNINTERRUPTIBLE
)之外的任何中断,否则请使用新的 TASK_KILLABLE
。
学习
TASK_UNINTERRUPTIBLE
状态中等待。 TASK_KILLABLE
函数方面的更多变化。chinaunix网友2010-09-29 14:29:02
很好的, 收藏了 推荐一个博客,提供很多免费软件编程电子书下载: http://free-ebooks.appspot.com