本文的copyleft归gfree.wind@gmail.com所有,使用GPL发布,可以自由拷贝,转载。但转载请保持文档的完整性,注明原作者及原链接,严禁用于任何商业用途。
作者:gfree.wind@gmail.com
博客:linuxfocus.blog.chinaunix.net
今天帮助同事调试一个问题,最终确定是在多线程下使用sigwait引发的。
该线程大致流程如下:- void thread(void *data)
- {
-
int wait_sig = *(int*)data;
-
sigset_t sigset;
-
-
sigemptyset(&sigset);
-
sigaddset(&sigset, wait_ig);
-
-
while (1) {
-
int signal;
-
if (0 != sigwait(&sigset, &signal)) {
-
break;
-
}
- }
- }
出现的问题是这个断言失败,也就是说sigwait失败了。后来打印出sigwait的返回值,发现sigwait的失败的原因时EINTR,也就说
sigwait被一个信号中断了,但是不知道信号来自何处。说到此处,先说明一下,sigwait这个函数很奇怪,跟一般的linux
API不同。sigwait出错的时候,并不设置errno,而直接把errno错误值返回。
通过增加一个新的判断
- int ret = sigwait(&sigset, &signal));
- if (EINTR == ret) {
-
continue;
- }
- else if (ret) {
-
break;
- }
毕竟sigwait作为一个阻塞操作,因为收到信号而失败,是可以接受的行为,所以要对EINTR进行特殊处理。
加上这一句后,发现原来在另外一个线程有一个非法内存错误,所以产生了一个SIGSEGV信号。到此,虽然这个问题是由于这个内存问题引起的,但是实际上从这个问题的现象上看,在多线程下使用sigwait容易引起一些问题。
1.在POSIX标准中,当进程收到信号时,如果是多线程的情况,我们是无法确定是哪一个线程处理这个信号。而sigwait是从进程中pending的信号中,取走指定的信号。这样的话,如果要确保sigwait这个线程收到该信号,那么所有线程含主线程以及这个sigwait线程则必须block住这个信号。否则如果在两次sigwait之间,收到了指定信号,该信号很有可能被任意一个线程处理掉。
2.sigwait的名字以及在man中的介绍容易引起人的误解。
1)sigwait,从名字上看只等待指定信号集。这样很容易让人感觉除指定信号外,其他信号不会促使sigwait的返回;
2)来看看man中的说明The sigwait() function suspends execution of the calling thread until the delivery of one of the signals specified in the signal set set.这里也说了,sigwait会一直suspend直到指定信号发生。另外,man中的errors说明也容易引起误解。man中只有一个错误,就是EINVAL,给人感觉sigwait不会被信号中断。
ERRORS
EINVAL set contains an invalid signal number.
(我的系统是FC12)
但是按照我一直以来的经验,基本上所有的阻塞操作都会被信号中断,除非设置了RESTART标志。所有我建议同事加了以上的代码。
后来看到man中还有这么一句,
NOTES
sigwait() is implemented using sigtimedwait(2).
于是又查看了sigtimedwait。发现sigtimedwait的手册还是比较完整的。
ERRORS
EAGAIN No signal in set was delivered within the timeout period specified to sigtimedwait().
EINTR The wait was interrupted by a signal handler; see signal(7). (This handler was for a signal other than one of those in set.)
EINVAL timeout was invalid.
其实这次的代码是一个开源工具的代码,它使用信号机制作为多线程的通讯工具。个人感觉这种实现并不合适。因为在它的代码中,并没有在所有的线程中屏蔽掉需要sigwait的信号,另外该工具会产生多个线程,每个线程需要sigwait的信号是不同的。按照上面的代码,实际上它只是通过sigwait等到相应的信号来唤醒该线程,那么还不如使用pthread_cond_wait来代替sigwait呢。
阅读(1405) | 评论(0) | 转发(0) |