首页　| 　博文目录　| 　关于我

博客访问： 560747
博文数量： 469
博客积分： 50
博客等级：民兵
技术积分： 1495
用户组：普通用户
注册时间： 2012-03-15 21:04

文章分类

全部博文（469）

大数据（2）
python（9）
ui（1）
rtmp（1）
google技术（1）
linux内核2015（2）
iphone（35）
java（3）
linux（30）
流媒体（22）
运维（8）
android内核之旅（2）
linux内核（163）
ffmpeg（63）
工具类（1）
安全（4）
算法（13）
c（66）

编程（3）

memcached（20）

libevent（20）

网络（16）

vim（1）
android（42）
shell（1）
未分配的博文（0）

文章存档

2015年（81）

2014年（125）

2013年（261）

2012年（2）

我的朋友

1. ET模式实现分析

1.1 ET和LT的实现区别

首先给出下面一张图，这张图是从我之前的一篇博文——epoll实现分析中摘取并细化的。这张图对理解ET模式已经epoll的工作过程只管重要，当然我自己总结出来后也感觉有的小成就，在这里与大家分享。

注：上图的poll不要理解成和select相似那个poll，这是通过epoll_ctl调用的。

下面简要分析一下epoll的工作过程：

(1) epoll_wait调用ep_poll，当rdlist为空（无就绪fd）时挂起当前进程，知道rdlist不空时进程才被唤醒。

(2) 文件fd状态改变（buffer由不可读变为可读或由不可写变为可写），导致相应fd上的回调函数ep_poll_callback()被调用。

(3) ep_poll_callback将相应fd对应epitem加入rdlist，导致rdlist不空，进程被唤醒，epoll_wait得以继续执行。

(4) ep_events_transfer函数将rdlist中的epitem拷贝到txlist中，并将rdlist清空。

(5) ep_send_events函数（很关键），它扫描txlist中的每个epitem，调用其关联fd对用的poll方法（图中蓝线）。此时对poll的调用仅仅是取得fd上较新的events（防止之前events被更新），之后将取得的events和相应的fd发送到用户空间（封装在struct epoll_event，从epoll_wait返回）。之后如果这个epitem对应的fd是LT模式监听且取得的events是用户所关心的，则将其重新加入回rdlist（图中蓝线），否则（ET模式）不在加入rdlist。

具体代码：

/* 扫描整个txlist链表... */

for (eventcnt = 0, uevent = esed->events;

!list_empty(head) && eventcnt < esed->maxevents;) {

/* 取出第一个成员 */

epi = list_first_entry(head, struct epitem, rdllink);

/* 然后从链表里面移除 */

list_del_init(&epi->rdllink);

/* 读取events,

* 注意events我们ep_poll_callback()里面已经取过一次了, 为啥还要再取?

* 1. 我们当然希望能拿到此刻的最新数据, events是会变的~

* 2. 不是所有的poll实现, 都通过等待队列传递了events, 有可能某些驱动压根没传

* 必须主动去读取. */

revents = epi->ffd.file->f_op->poll(epi->ffd.file, NULL) &

epi->event.events;

if (revents) {

/* 将当前的事件和用户传入的数据都copy给用户空间,

* 就是epoll_wait()后应用程序能读到的那一堆数据. */

if (__put_user(revents, &uevent->events) ||

__put_user(epi->event.data, &uevent->data)) {

/* 如果copy过程中发生错误, 会中断链表的扫描,

* 并把当前发生错误的epitem重新插入到ready list.

* 剩下的没处理的epitem也不会丢弃, 在ep_scan_ready_list()

* 中它们也会被重新插入到ready list */

list_add(&epi->rdllink, head);

return eventcnt ? eventcnt : -EFAULT;

}

eventcnt++;

uevent++;

if (epi->event.events & EPOLLONESHOT)

epi->event.events &= EP_PRIVATE_BITS;

else if (!(epi->event.events & EPOLLET)) {

* If this file has been added with Level

* Trigger mode, we need to insert back inside

* the ready list, so that the next call to

* epoll_wait() will check again the events

* availability. At this point, noone can insert

* into ep->rdllist besides us. The epoll_ctl()

* callers are locked out by

* ep_scan_ready_list() holding "mtx" and the

* poll callback will queue them in ep->ovflist.

/* 嘿嘿, EPOLLET和非ET的区别就在这一步之差呀~

* 如果是ET, epitem是不会再进入到readly list,

* 除非fd再次发生了状态改变, ep_poll_callback被调用.

* 如果是非ET, 不管你还有没有有效的事件或者数据,

* 都会被重新插入到ready list, 再下一次epoll_wait

* 时, 会立即返回, 并通知给用户空间. 当然如果这个

* 被监听的fds确实没事件也没数据了, epoll_wait会返回一个0,

* 空转一次.

list_add_tail(&epi->rdllink, &ep->rdllist);

}

说明：

l epoll_wait返回的条件是rdlist不空，而使rdlist不空的途径有两个，分别对应图中的红线和蓝线。

l ET和LT模式下的epitem都可以通过红线方式加入rdlist从而唤醒epoll_wait，但LT模式下的epitem还可以通过蓝线方式重新加入rdlist唤醒epoll_wait。所以ET模式下，fd就绪（通过红线加入rdlist）只会被通知一次，而LT模式下只要满足相应读写条件就返回就绪（通过蓝线加入rdlist）。

l ET事件发生仅通知一次的原因是只被添加到rdlist中一次，而LT可以有多次添加的机会。

1.2 两种加入rdlist途径的不同

下面我们来分析一下图中两种将epitem加入rdlist方式（也就是红线和蓝线）的区别。

l 红线：fd状态改变是才会触发。那么什么情况会导致fd状态的改变呢？

对于读取操作：

(1) 当buffer由不可读状态变为可读的时候，即由空变为不空的时候。

(2) 当有新数据到达时，即buffer中的待读内容变多的时候。

对于写操作：

(1) 当buffer由不可写变为可写的时候，即由满状态变为不满状态的时候。

(2) 当有旧数据被发送走时，即buffer中待写的内容变少得时候。

l 蓝线：fd的events中有相应的时间（位置1）即会触发。那么什么情况下会改变events的相应位呢？

对于读操作：

(1) buffer中有数据可读的时候，即buffer不空的时候fd的events的可读为就置1。

对于写操作：

(1) buffer中有空间可写的时候，即buffer不满的时候fd的events的可写位就置1。

说明：红线是时间驱动被动触发，蓝线是函数查询主动触发。

阅读(361) | 评论(0) | 转发(0) |

上一篇：推荐一个压力测试工具stressmark

下一篇：彻底学会使用epoll（二）——ET和LT的触发方式

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6