9 IO复用
#include
int select(int nfds, fd_set* readfds, fd_set* writefds, fd_set* exceptfds, struct timeval* timeout);
nfds指定被监听的文件描述符的总数。通常是select监听的所有文件描述符的最大值加1,因为文件描述符从0开始计数。
#include
#define __FD_SETSIZE 1024
#include
#define FD_SETSIZE __FD_SETSIZE
typedef long int __fd_mask;
#undef __UFDBITS
#define __NFDBITS (8*(int)sizeof(__fd_mask))
typedef struct{
#ifdef __USE_XOPEN
__fd_mask fds_bits[__FD_SETSIZE/__NFDBITS];
#define __FDS_BITS(set) ((set)->fds_bits)
#else
__fd_mask __fds_bits[__FD_SETSIZE/__NFDBITS];
#define __FDS_BITS(set) ((set)->__fds_bits)
#endif
}fd_set;
由以上定义可见,fd_set结构体仅仅包含一个整型数组,该数组的每一个元素的每一个位(bit)标记一个文件描述符。fd_set能容纳的文件描述符数量由FD_SETSIZE指定,这就限制了select能同时处理的文件描述符的总量。
由于位操作过于繁琐,所以应该使用下面一系列宏来访问fd_set结构体中的位:
#include
FD_ZERO(fd_set *fdset);
FD_SET(int fd, fd_set *fdset);
FD_CLR(int fd, fd_set *fdset);
int FD_ISSET(int fd, fd_set *fdset);
struct timeval{
long tv_sec;
long tv_usec;
};
文件描述符就绪条件:
socket可读:
1、socket内核接收缓冲区中的字节数目大于或等于其低水平标记SO_RCVLOWAT。
2、socket通信的对方关闭连接。此时对该socket的读操作将返回0.
3、监听socket上有新的连接请求。
4、socket上有未处理的错误。此时我们可以使用getsockopt来读取和清除该错误。
socket可写:
1、socket内核发送缓冲区中的可用字节数大于或等于其低水平标记SO_SNDLOWAT。
2、socket的写操作被关闭。对写操作被关闭的socket执行写操作将触发一个SIGPIPE信号。
3、socket使用非阻塞connect连接成功或者失败(超时)之后。
4、socket上有未处理的错误。此时我们可以使用getsockopt来读取和清除该错误。
网络程序中,select能处理的异常情况只有一种:socket上接收到带外数据。
poll和select类似,也是在指定时间内轮询一定数量的文件描述符,以测试其中是否有就绪者。
#include
int poll(struct pollfd* fds, nfds_t nfds, int timeout);
struct pollfd{
int fd;
short events;//注册的事件
short revents;//实际发生的事件,由内核填充
};
events成员告诉poll监听fd上的哪些事件,它是一系列事件的按位或;revents成员则由内核修改,以通知应用程序fd上实际发生了哪些事件。
poll事件类型:
POLLIN//
POLLRDNORM//
POLLPRI//
POLLOUT//
POLLWRNORM//
POLLWRBAND//
POLLRDHUP//TCP连接被对方关闭,或者对方关闭了写操作。
POLLERR//
POLLHUP//挂起。比如管道的写端被关闭后,读端描述符上将收到POLLHUP事件
POLLNVAL//文件描述符没有打开
通常,应用程序需要根据recv调用的返回值来区分socket上接收到的是有效数据还是对方关闭连接的请求,并做相应的处理。不过,自linux内核2.6.17开始,GNU为poll系统调用增加了一个POLLRDHUP事件,它在socket上接收到对方关闭连接的请求之后触发。这为我们区分上述两种情况提供了一种更简单的方式。但是用POLLRDHUP事件时,我们需要在代码最开始处定义_GNU_SOURCE。
nfds参数指定被监听事件集合fds的大小。其类型nfds_t的定义如下:
typedef unsigned long int nfds_t;
timeout指定poll超时值,单位是毫秒。当timeout为-1时,poll调用将永远阻塞,直到某个事件发生;当timeout为0时,poll调用将立即返回。
epoll系列系统调用:
内核事件表:
epoll使用一组函数来完成任务,而不是单个函数。其次,epoll把用户关心的文件描述符上的事件放在内核里的一个事件表中,从而无须像select、poll那样每次调用都要重复传入文件描述符集或事件集。但epoll需要使用一个额外的文件描述符,来唯一标识内核中的这个事件表。这个文件描述符使用epoll_create函数来创建:
#include
int epoll_create(int size);
size参数现在并不起作用,只是给内核一个提示,告诉它事件表需要多大。
操作内核事件表:
int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event);
op参数指定操作类型:
EPOLL_CTL_ADD
EPOLL_CTL_MOD
EPOLL_CTL_DEL
event参数指定事件,它是epoll_event结构指针类型。epoll_event的定义如下:
struct epoll_event{
__uint32_t events;//epoll事件
epoll_data_t data;//用户数据
};
epoll有两个额外的事件类型--EPOLLET和EPOLLONESHOT。
data成员用于存储用户数据,其类型epoll_data_t的定义如下:
typedef union epoll_data{
void* ptr;
int fd;
uint32_t u32;
uint64_t u64;
}epoll_data_t;
联合体中4个成员中使用最多的是fd, 它指定事件所从属的目标文件描述符。ptr成员可用来指定与fd相关的用户数据。
int epoll_wait(int epfd, struct epoll_event* events, int maxevents, int timeout);
成功时返回就绪的文件描述符的个数,失败时返回-1并设置errno。
timeout含义与poll相同,单位毫秒。
maxevents参数指定最多监听多少个事件,必须大于0.
epoll_wait函数如果检测到事件,就将所有就绪的事件从内核事件表(由epfd参数指定)中复制到它的第二个参数events指向的数组中。这个数组只用于输出epoll_wait检测到的就绪事件,而不像select和poll的数组参数那样既用于传入用户注册的事件,又用于输出内核检测到的就绪事件。这就极大的提高了应用程序索引就绪文件描述符的效率。
epoll的两种工作模式LT和ET,默认情况是LT模式,ET是高效模式。
LT模式下,当epoll_wait检测到有事件发生并将此事件通知应用程序后,应用程序可以不立即处理该事件。这样应用程序下次调用epoll_wait时,epoll_wait还会再次向应用程序通告此事件,直到该事件被处理。ET模式下,epoll_wait检测到其上有事件发生并将此事件通知应用程序后,应用程序必须立即处理该事件,因为后续的epoll_wait调用将不再向应用程序通知这一事件。可见,ET模式降低了同一个epoll事件被重复触发的次数,因此效率比LT高。
EPOLLONESHOT事件:
即使我们使用ET模式,一个socket上的某个事件还是可能被触发多次。这在并发程序中就会引起一个问题。如一个线程(或进程,下同)在读取完某个socket上的数据后开始处理这些数据,而在数据的处理过程中该socket上又有新数据可读(EPOLLIN再次被触发),此时另一个线程被唤醒来读取这些新的数据。于是出现了两个线程同时操作一个socket的局面。这当然不是我们期望的。我们期望的是一个socket连接在任一时刻都只被一个线程处理。这一点可以使用epoll的EPOLLONESHOT事件实现。
对于注册了EPOLLONESHOT事件的文件描述符,操作系统最多触发其上注册的一个可读、可写或者异常事件,且只触发一次,除非我们使用epoll_ctl函数重置该文件描述符上注册的EPOLLONESHOT事件。这样,当一个线程在处理某个socket时,其他线程是不可能有机会操作该socket的。但反过来思考,注册了EPOLLONESHOT事件的socket一旦被某个线程处理完毕,该线程就应该立即重置这个socket上的EPOLLONESHOT事件,以确保这个socket下一次可读时,其EPOLLIN事件能被触发,进而让其他工作线程有机会继续处理这个socket。
阅读(2098) | 评论(0) | 转发(0) |