Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1798062
  • 博文数量: 438
  • 博客积分: 9799
  • 博客等级: 中将
  • 技术积分: 6092
  • 用 户 组: 普通用户
  • 注册时间: 2012-03-25 17:25
文章分类

全部博文(438)

文章存档

2019年(1)

2013年(8)

2012年(429)

分类: 系统运维

2012-03-30 20:02:33

在8.13节,我们展示了一个system函数的实现。然而,那个版本没有处理信号。POSIX.1要求system忽略SIGINT和SIGQUIT并阻塞SIGCHLD。在展示正确处理这些信号的版本之前,我们看下为什么需要担心这些信号的处理。


下 面的代码使用了8.13节的system版本来调用ed编辑器。(这个编辑器作为UNIX系统的一部分已经有很长时间了。我们在这里使用它是因为它是一个 捕获中断和退出信号的交互式程序。如果我们调用一个外壳并输入中断符,那么它捕获这个中断符并打印一个问号。ed程序也设置了退出信号的布署以便它被忽 略。)



  1. #include <signal.h>

  2. static void
  3. sig_int(int signo)
  4. {
  5.     printf("caught SIGINT\n");
  6. }

  7. static void
  8. sig_chld(int signo)
  9. {
  10.     printf("caught SIGCHLD\n");
  11. }

  12. int
  13. main(void)
  14. {
  15.     if (signal(SIGINT, sig_int) == SIG_ERR) {
  16.         printf("signal(SIGINT) error\n");
  17.         exit(1);
  18.     }
  19.     if (signal(SIGCHLD, sig_chld) == SIG_ERR) {
  20.         printf("signal(SIGCHLD) error\n");
  21.         exit(1);
  22.     }
  23.     if (system("/bin/ed") < 0) {
  24.         printf("system() error");
  25.         exit(1);
  26.     }
  27.     exit(0);
  28. }


上面的代码同时捕获了SIGINT和SIGCHLD。运行结果为:
$ ./a.out
a (添加文本命令)
Here is one line of text
. (终止添加模式)
1,$p (从第一行开始打印)
Here is one line of text
w temp.foo (把缓冲写入文件)
25 (写了25个字节)
q (退出)
caught SIGCHLD

当 编辑器终止时,系统向父进程(a.out进程)发送SIGCHLD信号。我们捕获它并从信号处理器返回。但是如果它正在捕获SIGCHLD信号,父进程应 该正这样做,因为它已经创建了它自己的子进程,以便知道它的子进程何时终止。在system函数执行时这个信号的分发应该在父进程里被阻塞。事实上,这是 POSIX.1规定的。否则,当system创建的子进程终止时,它将误导system的调用者认为它自己的一个子进程终止了。调用者然后会使用某个 wait函数来得到子进程的终止状态,因而避免system函数得到子进程的终止状态作为它的返回值。

如果我们再次运行程序,这次向编辑器发送一个中断信号,会有:
$ ./a.out
a
hello, world
.
1,$p
hello, world
w temp.foo
13
^Ccaught SIGINT

?
q
caught SIGCHLD


回想9.6节,输入中断符会导致中断信号被发送给前台进程组的所有进程。前台进程有a.out,/bin/sh和/bin/ed。


在 这个例子里,SIGINT被发送给所有这三个前台进程。(后台的外壳忽略这个信号。)正如我们能从输出看到的,a.out进程和编辑器捕获了这个信号。但 是当我们用system函数运行另一个程序时,我们不该让父进程和子进程同时捕获两个终端产生的信号:中断和退出。这两个信号应该被发送给实际正在运行的 程序:子进程。因为system执行的命令可以是一个交互式命令(这个例子里是ed程序),而且system的调用者在程序执行时放弃了控制而等待它的结 束,所以system的调用者不应该收到这两个终端产生的信号。这是为什么POSIX.1规定system函数应该在等待命令完成时忽略这两个信号。


下面的代码展示了含所需的信号处理的system函数的一个实现:



  1. #include <sys/wait.h>
  2. #include <errno.h>
  3. #include <unistd.h>

  4. int
  5. system(const char *cmdstring) /* with appropriate signal handling */
  6. {
  7.     pid_t pid;
  8.     int status;
  9.     struct sigaction ignore, saveintr, savequit;
  10.     sigset_t chldmask, savemask;

  11.     if (cmdstring == NULL)
  12.         return(1); /* always a command processor with UNIX */

  13.     ignore.sa_handler = SIG_IGN; /* ignore SIGINT and SIGQUIT */
  14.     sigemptyset(&ignore.sa_mask);
  15.     ignore.sa_flags = 0;
  16.     if (sigaction(SIGINT, &ignore, &saveintr) < 0)
  17.         return(-1);
  18.     if (sigaction(SIGQUIT, &ignore, &savequit) < 0)
  19.         return(-1);
  20.     sigemptyset(&chldmask); /* now block SIGCHLD */
  21.     sigaddset(&chldmask, SIGCHLD);
  22.     if (sigprocmask(SIG_BLOCK, &chldmask, &savemask) < 0)
  23.         return(-1);

  24.     if ((pid = fork()) < 0) {
  25.         status = -1; /* probably out of processes */
  26.     } else if (pid == 0) { /* child */
  27.         /* restore previous signal actions & reset signal mask */
  28.         sigaction(SIGINT, &saveintr, NULL);
  29.         sigaction(SIGQUIT, &savequit, NULL);
  30.         sigprocmask(SIG_SETMASK, &savemask, NULL);

  31.         execl("/bin/sh", "sh", "-c", cmdstring, (char *)0);
  32.         _exit(127); /* exec error */
  33.     } else { /* parent */
  34.         while (waitpid(pid, &status, 0) < 0)
  35.             if (errno != EINTR) {
  36.                 status = -1; /* error other than EINTR from waitpid() */
  37.                 break;
  38.             }
  39.     }

  40.     /* restore previous signal actions & reset signal mask */
  41.     if (sigaction(SIGINT, &saveintr, NULL) < 0)
  42.         return(-1);
  43.     if (sigaction(SIGQUIT, &savequit, NULL) < 0)
  44.         return(-1);
  45.     if (sigprocmask(SIG_SETMASK, &savemask, NULL) < 0)
  46.         return(-1);

  47.     return(status);
  48. }


如果我们使用这个版本的system,得到的结果和前面(有缺陷的)那个的结果不同在于:

1、没有信号被发送给调用进程,当我们输入中断和退出符;

2、当ed命令退出时,SIGCHLD不会被发送到调用进程。事实上,它被阻塞,直到我们在最后一个sigprocmask的调用里反阻塞它,在system函数通过调用waitpid得到子进程的终止状态之后。

POSIX.1 指出如果wait或waitpid在SIGCHLD待定时返回了一个子进程的状态,那么SIGCHLD不应该被分发给进程,除非另一个子进程的状态也可 用。本书的四个实现没有一个实现了这个语义。相反,在system函数调用waitpid后SIGCHILD仍保持待定;当信号被反阻塞时,它被分发给了 调用者。如果我们在sig_chld里调用wait,它将返回-1,errno被设为ECHILD,因为system函数已经得到了子进程的终止状态。


许多老的书本都用如下方式忽略中断和退出信号:


if ((pid = fork()) < 0) {
  err_sys("fork error");
} else if (pid == 0) {
  /* child */
  execl(...);
  _exit(127);
}

/* parent */
old_intr = signal(SIGINT, SIG_IGN);
old_quit = signal(SIGQUIT, SIG_IGN);
waitpid(pid, &status, 0);
signal(SIGINT, old_intr);
signal(SIGQUIT, old_quit);


这个代码的问题是我们不能保证在fork后父子进程谁先运行。如果子进程先运行而父进程在之后一段时间之内没有运行,那么一个中断信号可能在父进程改变它的布署为被忽略是被产生。由于这个原因,我们新的system函数里在fork之间改变信号的布署。


注意我们必须在子进程里调用execl之前重置这两个信号的布署。这允许execl改变它们的布署为默认,基于调用者的布署,如在8.10节里描述的。


sytem的返回值


注 意system的返回值。它是外壳的终止状态,并不总是命令字符串的终止状态。我们在第8章看到过一些例子,而且结果和我们预料的一样:如果我们执行一个 简单的命令,比如date,那么终止状态是0。执行外壳命令exit 44给我们一个44的终止状态。用信号会发生什么呢?


让我们运行第8章的程序并发送一些信号给正在执行的命令:
$ tsys "sleep 30"
^Cnormal termination, exit status = 130
$ tsys "sleep 30"
^\sh: 946 quit
normal termination, exit status = 131


(我系统上没有这个问题。pr_exit打印出期望的值:异常退出。可能我的系统的system运行时,中断信号由“sh -c sleep 30”,而不是“sleep 30”响应。


当 我们用中断信号终止sleep时,pr_exit函数认为它正常终止。当我们用退出键杀死sleep时会发生同样的事。这里发生的事是Bourne外壳有 一个糟糕文档的特性,它终止状态是128加上一个信号号,当它正在执行的命令被一个信号终止时。我们可以用外壳交互地看下这个:
$ sh -c "sleep 30"
^C
$ ehco $?
130
$ sh -c "sleep 30"
^\sh: 962 Quit - core dumped
$ ehco $?
131
$ exit


在被使用的系统上,SIGINT的值为2,SIGQUIT的值为3,所以给了我们130和131的终止状态。


让我们尝试一个相似的例子,但是这次我们将直接向外壳发送一个信号并看system返回了什么:


$ ./tsys "sleep 30" &
$ ps -f
UID        PID  PPID  C STIME TTY          TIME CMD
tommy     8956  8949  0 12:04 pts/0    00:00:00 bash
tommy     9122  8956  0 12:23 pts/0    00:00:00 sh
tommy     9135  9122  0 12:25 pts/0    00:00:00 ./tsys sleep 30
tommy     9136  9135  0 12:25 pts/0    00:00:00 sh -c sleep 30
tommy     9137  9136  0 12:25 pts/0    00:00:00 sleep 30
tommy     9138  9122  0 12:25 pts/0    00:00:00 ps -f
$ kill -KILL 9136 (杀死“sh -c sleep 30”)
$ Killed
abnormal termination, signal number = 9


这里,我们可以看到system的返回值只当外壳自身异常终止时报告一个异常终止。如果杀死“sleep 30”而不是“sh -c sleep 30”:


$ ./tsys "sleep 30" &
$ ps -f
UID        PID  PPID  C STIME TTY          TIME CMD
tommy     8956  8949  0 12:04 pts/0    00:00:00 bash
tommy     9356  8956  0 12:47 pts/0    00:00:00 sh
tommy     9357  9356  0 12:47 pts/0    00:00:00 ./tsys sleep 30
tommy     9358  9357  0 12:47 pts/0    00:00:00 sh -c sleep 30
tommy     9359  9358  0 12:47 pts/0    00:00:00 sleep 30
tommy     9360  9356  0 12:47 pts/0    00:00:00 ps -f
$ kill -KILL 9359
$ Killed
normal termination, exit status = 137


当写一个使用system函数的程序时,要确保正确地解释返回值。如果你调用fork、exec和wait,终止状态和你调用system时的并不相同。

阅读(1546) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~