全部博文(108)
分类: LINUX
2015-04-20 09:14:43
原文地址:wait函数族和SIGCHLD信号的关系 作者:流云哭翠
进程一旦调用了wait,就立即阻塞自己,由wait自动分析是
否当前进程的某个子进程已经退出,如果让它找到了这样一个
已经变成僵尸的子进程, wait就会收集这个子进程的信息,并
把它彻底销毁后返回;如果没有找到这样一个子进程,wait就
会一直阻塞在这里,直到有一个出现为止。
参数status用来保存被收集进程退出时的一些状态,它是
一个指向int类型的指针。但如果我们对这个子进程是如何死掉
的毫不在意,只想把这个僵尸进程消灭掉,(事实上绝大多数
情况下,我们都会这样想),我们就可以设定这个参数为
NULL,就象下面这样: pid = wait(NULL);
如果成功,wait会返回被收集的子进程的进程ID,如果调用进
程没有子进程,调用就会失败,此时wait返回-1,同时errno被
置为ECHILD。
waitpid的函数原型是:
waitpid系统调用在Linux函数库中的原型是:
#include
pid_t waitpid(pid_t pid,int *status,int options)
从本质上讲,系统调用waitpid和wait的作用是完全相同
的,但waitpid多出了两个可由用户控制的参数pid和options,
从而为我们编程提供了另一种更灵活的方式。
下面我们就来详细介绍一下这两个参数:
● pid 从参数的名字pid和类型pid_t中就可以看出,
这里需要的是一个进程ID。但当pid取不同的值时,在这里有不
同的意义。 pid>0时,只等待进程ID等于pid的子进
程,不管其它已经有多少子进程运行结束退出了,只要指定的
子进程还没有结束,waitpid就会一直等下去。 pid=-
1时,等待任何一个子进程退出,没有任何限制,此时waitpid
和wait的作用一模一样。 pid=0时,等待同一个进程
组中的任何子进程,如果子进程已经加入了别的进程组,
waitpid不会对它做任何理睬。 pid<-1时,等待一个
指定进程组中的任何子进程,这个进程组的ID等于pid的绝对
值。
● options options提供了一些额外的选项来控制waitpid,
目前在Linux中只支持WNOHANG和WUNTRACED两个选项,
这是两个常数,可以用"|"运算符把它们连接起来使用,比如:
ret=waitpid(-1,NULL,WNOHANG | WUNTRACED);
如果我们不想使用它们,也可以把options设为0,如:
ret=waitpid(-1,NULL,0); 如果使用了WNOHANG参数
调用waitpid,即使没有子进程退出,它也会立即返回,不会像
wait那样永远等下去。 而WUNTRACED参数,由于
涉及到一些跟踪调试方面的知识,加之极少用到,这里就不多
费笔墨了,有兴趣的读者可以自行查阅相关材料。 看
到这里,聪明的读者可能已经看出端倪了--wait不就是经过包装
的waitpid吗?没错,察看<内核源码目录>/include/unistd.h文
件349-352行就会发现以下程序段: static inline
pid_t wait(int * wait_stat) { return waitpid(-
1,wait_stat,0); } 返回值和错误
waitpid的返回值比wait稍微复杂一些,一共有3种情况:
● 当正常返回的时候,waitpid返回收集到的子进程的进程ID;
● 如果设置了选项WNOHANG,而调用中waitpid发现没有已
退出的子进程可收集,则返回0;
● 如果调用中出错,则返回-1,这时errno会被设置成相应的
值以指示错误所在;当pid所指示的子进程不存在,或此进程存
在,但不是调用进程的子进程,waitpid就会出错返回,这时
errno被设置为ECHILD 其它: 调用 wait&waitpid 来处理终止
的子进程: pid_t wait(int * statloc); pid_t waitpid(pid_t pid,
int *statloc, int options); 两个函数都返回两个值:函数的返回
值和终止的子进程ID,而子进程终止的状态则是通过statloc指
针返回的。 wait&waitpid 的区别是显而易见的,wait等待第一
个终止的子进程,而waitpid则可以指定等待特定的子进程。这
样的区别可能会在下面这种情况时表现得更加明显:当同时有
5个客户连上服务器,也就是说有五个子进程分别对应了5个客
户,此时,五个客户几乎在同时请求终止,这样一来,几乎同
时,五个FIN发向服务器,同样的,五个SIGCHLD信号到达服
务器,然而,UNIX的信号往往是不会排队的,显然这样一来,
信号处理函数将只会执行一次,残留剩余四个子进程作为僵尸
进程驻留在内核空间。此时,正确的解决办法是利用waitpid(-
1, &stat, WNOHANG)防止留下僵尸进程。其中的pid为-1表
明等待第一个终止的子进程,而WNOHANG选择项通知内核在
没有已终止进程项时不要阻塞。
wait&waitpid 区别 :
waitpid提供了wait函数不能实现的3个功能: waitpid等待特定的
子进程, 而wait则返回任一终止状态的子进程; waitpid提供了一
个wait的非阻塞版本; waitpid支持作业控制(以WUNTRACED选
项). 用于检查wait和waitpid两个函数返回终止状态的宏: 这两个
函数返回的子进程状态都保存在statloc指针中, 用以下3个宏可
以检查该状态: WIFEXITED(status): 若为正常终止, 则为真. 此
时可执行 WEXITSTATUS(status): 取子进程传送给exit或_exit
参数的低8位. WIFSIGNALED(status): 若为异常终止, 则为真.
此时可执行 WTERMSIG(status): 取使子进程终止的信号编号.
WIFSTOPPED(status): 若为当前暂停子进程, 则为真. 此时可
执行 WSTOPSIG(status): 取使子进程暂停的信号编号
二、SIGCHLD信号
简单的说,子进程退出时父进程会收到一个SIGCHLD信号,默认的处理是忽略这个信号,而常规的做法是在这个信号处理函数中调用wait函数获取子进程的退出状态。
三、既然在SIGCHLD信号的处理函数中要调用wait函数族,为什么有了wait函数族还需要使用SIGCHLD信号?
我们知道,unix中信号是采用异步处理某事的机制,好比说你准备去做某事,去之前跟邻居张三说如果李四来找你的话就通知他一声,这让你可以抽身出来去做这件事,而李四真正来访时会有人通知你,这个就是异步信号一个较为形象的比喻。
一般的,父进程在生成子进程之后会有两种情况:一是父进程继续去做别的事情,类似上面举的例子;另一是父进程啥都不做,一直在wait子进程退出,因为有时候父进程依赖子进程干完某事后才能继续 。
SIGCHLD信号就是为这第一种情况准备的,它让父进程去做别的事情,而只要父进程注册了处理该信号的函数,在子进程退出时就会调用该函数,在函数中wait子进程得到终止状态之后再继续做父进程的事情。
最后,我们来明确以下二点:
1)凡父进程不调用wait函数族获得子进程终止状态的子进程在退出时都会变成僵尸进程。
2)SIGCHLD信号可以异步的通知父进程有子进程退出。