说说tcp_sacktag_write_queue函数的改动-hritian-ChinaUnix博客

tcp协议优化qostcp.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

hritian

博客访问： 229326
博文数量： 17
博客积分： 1545
博客等级：上尉
技术积分： 302
用户组：普通用户
注册时间： 2009-02-12 21:59

文章分类

全部博文（17）

文章存档

2011年（8）

2010年（5）

2009年（4）

我的朋友

相关博文

说说tcp_sacktag_write_queue函数的改动

分类： LINUX

2011-02-16 01:30:04

最近在把代码从18移植到 32的内核上，发现tcp_sacktag_write_queue函数改的面目全非，搞得我十分头大，火大。
关于该函数的详细分析，请看http://simohayha.javaeye.com/blog/578744 ，我就不转载了。
比较大的变化有三个
1 tp->recv_sack_cache[]真正派上了用场，通过与上一次的sack块的比照，减少对发送缓存中的skb的查找次数。
对每个新sack块，比较是不是以前的sack块里面已经有了，如果已经有了，ok，可以直接退出来，如果没有顺序查找到，并将相应的发送包标记。如果新sack块的序号大于以前最大的那个sack块，那么直接跳到标记的最大的那个sack块。
如此，让我们假设一下重传包不丢，没有乱序的情况（这个是绝大多数的情况），对于sack包的处理，每次丢包是0（n），而在以前（我应该没记错）是o（kn），k=收到的sack包的数量。如果cwnd=1000，好吧，这个悲剧大了。
详细请看这一段的代码：
while (tcp_sack_cache_ok(tp, cache) &&
               !before(start_seq, cache->end_seq))
            cache++;

        /* Can skip some work by looking recv_sack_cache? */
        if (tcp_sack_cache_ok(tp, cache) && !dup_sack &&
            after(end_seq, cache->start_seq)) {

            /* Head todo? */
            if (before(start_seq, cache->start_seq)) {
                skb = tcp_sacktag_skip(skb, sk, &state,
                               start_seq);
                skb = tcp_sacktag_walk(skb, sk, next_dup,
                               &state,
                               start_seq,
                               cache->start_seq,
                               dup_sack);
            }

            /* Rest of the block already fully processed? */
            if (!after(end_seq, cache->end_seq))
                goto advance_sp;

            skb = tcp_maybe_skipping_dsack(skb, sk, next_dup,
                               &state,
                               cache->end_seq);

            /* ...tail remains todo... */
            if (tcp_highest_sack_seq(tp) == cache->end_seq) {
                /* ...but better entrypoint exists! */
                skb = tcp_highest_sack(sk);
                if (skb == NULL)
                    break;
                state.fack_count = tp->fackets_out;
                cache++;
                goto walk;
            }

            skb = tcp_sacktag_skip(skb, sk, &state, cache->end_seq);
            /* Check overlap against next cached too (past this one already) */
            cache++;
            continue;
        }

        if (!before(start_seq, tcp_highest_sack_seq(tp))) {
            skb = tcp_highest_sack(sk);
            if (skb == NULL)
                break;
            state.fack_count = tp->fackets_out;
        }

2 合并被确认的skb
新增加的函数tcp_shift_skb_data ，如此好处依然是提高效率，把相邻的包整合在一块，这样每次查找的数量就会更加减少（尤其是在重传丢包的时候），其查找次数和丢包的个数成正比，而不是与以前的（最坏情况下）和窗口成正比。

说到这，我可以来说一个我的亲身体会，如假包换，当时是拿TCP协议栈去和类FEC编码的算法去比，看谁的速度快。当时我们在300ms的rtt和10-20%的丢包率情况下，跑出了2MB的速度，但是，悲剧的发现，跑了10几个连接之后，一个CPU就耗完了。现在看来，如果我们是在32的内核上跑的话，性能应该会好很多。

3 重写了发现重传包丢失的函数
相比18内核（顺带说一下，有文献已经证明18内核在发送重传包丢掉这个问题上是有bug的），这是一个很巧妙的算法，重传包以前，记住下一个要顺序发送的包（非重传包），如果这个包收到了，重传包还没有收到，那肯定就是丢掉了。

                                                                                                                   泓日天

阅读(3227) | 评论(1) | 转发(0) |

上一篇：细数一下这两年做的一些事情

下一篇：linxu内核拥塞控制模块的实现

给主人留下些什么吧！~~

chinaunix网友2011-03-21 09:51:36