Chinaunix首页 | 论坛 | 博客
  • 博客访问: 754967
  • 博文数量: 130
  • 博客积分: 2951
  • 博客等级: 少校
  • 技术积分: 1875
  • 用 户 组: 普通用户
  • 注册时间: 2010-03-04 18:32
文章分类

全部博文(130)

文章存档

2013年(1)

2012年(129)

分类: LINUX

2012-10-26 16:41:39

当有多个子进程的SIGCHLD信号到达父进程的时候,如果父进程用wait等待,那么父进程在处理第一个达到的SIGCHLD信号的时候,其他的SIGCHLD信号被堵塞,而且信号不被缓存,这样就会导致信号丢失,这样会产生很多的僵尸进程。。解决办法是父进程用waitpid来等待子进程信号。。。

正好看到有人问这样一个问题

看unix网络编程第一卷的时候,碰到书上这样一个例子:
一个并发服务器, 每一个客户端连接服务器就fork一个子进程.书上讲到当同时有n多个客户端断开连接时,
服务器端同时有n多个子进程终止, 这时候内核同时向父进程发送n多个sigchld信号.它的sigchld信号处理
函数如下:
void sig_chld(int signo)
{
       pid_t   pid;
       int     stat;
      
       while((pid = waitpid(-1, &stat, WNOHANG)) > 0){
               printf("child %d terminated\n", pid);
       }
        return;
}

我的问题是:既然sigchld是不可靠的信号,进程就不可能对sigchld进行排队, 直接丢弃了sigchld信号(当进程注册信号的时候,发现已有sigchld注册进未决信号, 因为内核同时发送多个sigchld).请问大家上面的代码是如何保证不产生僵尸进程的.谢谢!

超清晰的解答,来自与chinaunix论坛的flw大版主。。。:

  1. 根本就不需要找回来!
  2. 好比有五个进程,
  3. 不妨分别称为 p1 p2 p3 p4 p5,
  4. 一开始 p1 结束了,发了一个 SIGCHLD(s1),
  5. 这时父进程可能空闲了,于是开始处理这个信号,假设处理的过程中 p2 又结束了,又发了一个 SIGCHLD(s2),
  6. 这时候已经有两个信号了(一个正在处理,一个待处理),这时如果 p3 又结束了,那么它发的那个 SIGCHLD(s3) 势必会丢失,
  7. 丢失了怎么办?
  8. 没关系,因为那个信号处理函数是个循环嘛,
  9. 所以 while(waitpid()) 的时候,会把 p1 p2 p3 都处理的。
  10. 即使是很不幸,因为十分凑巧的原因,p3 没有被回收,导致变成僵尸进程了,也没关系,
  11. 因为还有 p4 p5 嘛,等到 p4 或者 p5 结束的时候,
  12. 又会再一次调用 while(waitpid()),到时候虽说这个 while(waitpid()) 是由 p4/p5 引起的,但是它也会一并把 p3 也处理的,因为它是个循环嘛!

  13. 如果还搞不懂,你就再看看 waitpid 的 man。

  14. 记住一点:
  15. waitpid 和 SIGCHLD 没关系,即使是某个子进程对应的 SIGCHLD 丢失了,只要父进程在任何一个时刻调用了 waitpid,那么这个进程还是可以被回收的。

  16. 哎呀呀,简直费劲死了,其实说白了,就是一个“生产者-消费者”问题。
  17. 子进程结束的时候,系统“生产”出一个僵尸进程,
  18. 同时用 SIGCHLD 通知父进程来“消费”这个僵尸进程,
  19. 即使是 SIGCHLD 丢失了,没有来得及消费,
  20. 但是只要有一次消费,就会把所有的僵尸进程都处理光光!
  21. (我再说一遍:因为,while(waitpid()) 是个循环嘛!)
我试了一下,wait好像也可以哦

  1. #include <sys/types.h>
  2. #include <sys/wait.h>
  3. #include <unistd.h>
  4. #include <stdio.h>
  5.  
  6. int main()
  7. {
  8.   pid_t pc, pr;
  9.   pc = fork();
  10.   if(pc<0){
  11.     printf("fork error\n");
  12.   }else if(pc == 0){
  13.         printf("child pid = %d\n", getpid());
  14.   }else{
  15.         pr = fork();
  16.         if(pr == 0)
  17.                 printf("child pid = %d\n", getpid());
  18.         else{

  19.                 printf("parent pid = %d\n", getpid());
  20.                 sleep(20);
  21.                 while((pr = wait(NULL)) != -1)
  22.                         ;
  23.                 printf("this is parent process.\n");
  24.                 sleep(20);
  25.         }
  26.   }
  27.  
  28.   exit(0);
  29. }
运行后,
程序先输出
child pid = 14478
parent pid = 14477
child pid = 14479
然后进入sleep(20);  这时候 开另一个terminal, 运行 ps auxw | grep 1447, 得到
1000     14477  0.0  0.0   4124   316 pts/3    S+   05:36   0:00 ./wait
1000     14478  0.0  0.0      0     0 pts/3    Z+   05:36   0:00 [wait]
1000     14479  0.0  0.0      0     0 pts/3    Z+   05:36   0:00 [wait]

1000     14499  0.0  0.0 109244   868 pts/5    S+   05:36   0:00 grep --color=auto 1447

可以看到,两个子进程已经编程僵尸进程

然后20秒后,父进程执行了wait() ,输出
child pid = 14478
parent pid = 14477
child pid = 14479
this is parent process.

这时候,到另一个终端里,再次运行ps
1000     14477  0.0  0.0   4124   316 pts/3    S+   05:36   0:00 ./wait
1000     14619  0.0  0.0 109244   872 pts/5    S+   05:37   0:00 grep --color=auto 1447

可以看到两个僵尸子进程已经被回收。。


阅读(5354) | 评论(1) | 转发(3) |
0

上一篇:NIM与SCS

下一篇:kpartx 命令

给主人留下些什么吧!~~

wuyinting1232014-08-14 11:12:58

如果你在printf("child pid = %d\n", getpid())前sleep,而去除其余的sleep函数,就会发现,wait是阻塞的,程序需要等sleep执行完,而调用waitpid设置option为WNOHANG,则程序不会阻塞