Linux网络子系统中ipv4对GRO的处理-lin_ux

lin_ux_linux的ChinaUnix博客

首页　| 　博文目录　| 　关于我

lin_ux_linux

博客访问： 287391
博文数量： 72
博客积分： 0
博客等级：民兵
技术积分： 276
用户组：普通用户
注册时间： 2014-07-28 23:52

文章分类

全部博文（72）

python（1）
lisp（1）
安全（8）

rfc翻译（5）

分析（1）

指南（2）
web（4）
kerberos（1）
网络（1）
linux系统（41）

nginx（4）

命令部分（4）

网络子系统（10）

netfilter（23）
c语言（5）

学习（1）

多态（1）
系统操作（8）

win7（5）
vm（1）
声明（1）
未分配的博文（0）

文章存档

2017年（20）

2014年（52）

我的朋友

相关博文

Linux网络子系统中ipv4对GRO的处理

分类： LINUX

2014-10-16 16:59:33

原文地址：Linux网络子系统中ipv4对GRO的处理作者：guanglongxishui

本文介绍一下网络层中IPv4协议对GRO的支持。从第五节中我们知道，每个支持GRO功能的协议都要实现自己的接收和完成函数。
ipv4协议的定义如下：

file:// net/ipv4/af_inet.c
static struct packet_type ip_packet_type __read_mostly = {
.type = cpu_to_be16(ETH_P_IP),
.gro_receive = inet_gro_receive,
.gro_complete = inet_gro_complete,
};
IPv4协议中对GRO的支持在网络层并不对报文进行合并，IP分片报文会在IP层进行重组，没有放在GRO中进行重组。个人理解是IPv4 分片包文的重组比较复杂，并且报文从链路层上来就直接送IP层进行处理了，没必要再在接收端进行分片报文的重组，另一个原因是因为要经过三层转发的IP分片报文没必要在这里重组，所以IP分片报文是否需要重组就直接由IP层进行决定了，没有交给GRO来处理。

IPv4在IP层只是根据一定的规则进行报文的匹配，匹配后送传输层进行GRO的合并处理。因为传输层的报文都会经过ip层进行处理，如果在接收端进行了重组后再送ip层处理，这样就减少了ip层处理报文的个数，会对性能有一定的优化。

IPv4的GRO接收函数：
匹配规则：
1、两个报文的源IP和目的IP地址相同
2、两个报文的传输层协议相同
3、两个报文的IP头中tos字段相同

static struct sk_buff **inet_gro_receive(struct sk_buff **head,struct sk_buff *skb)
{
const struct net_protocol *ops;
struct sk_buff **pp = NULL;
struct sk_buff *p;
struct iphdr *iph;
unsigned int hlen;
unsigned int off;
unsigned int id;
int flush = 1;
int proto;
/*根据GRO的私有字段data_offset找到IP层要读取数据的偏移量,
*这时GRO要读取的就是IP头
*/
off = skb_gro_offset(skb);
hlen = off + sizeof(*iph);

/*根据偏移量找到IP头*/
iph = skb_gro_header_fast(skb, off);
/*如果线性区内不包含IP头，就把非线性区的IP头部分拷贝到线性区，
*方便以后的处理。如果skb是线性的，
*NAPI_GRO_CB(skb)->frag0 为NULL，
*上边根据偏移量找ip头是找不到的，
*这时可直接根据skb->data和偏移量找到IP头。
*/
if (skb_gro_header_hard(skb, hlen))
{
iph = skb_gro_header_slow(skb, hlen, off);
if (unlikely(!iph))
goto out;
}
/*取出报文的传输层协议类型*/
proto = iph->protocol & (MAX_INET_PROTOS - 1);
rcu_read_lock();
ops = rcu_dereference(inet_protos[proto]);
/*如果传输层不支持GRO，就直接返回不进行GRO处理*/
if (!ops || !ops->gro_receive)
goto out_unlock;
if (*(u8 *)iph != 0x45)
goto out_unlock;
/*判断一下报文的校验和*/
if (unlikely(ip_fast_csum((u8 *)iph, iph->ihl)))
goto out_unlock;
/*如果报文是分片报文，设置flush位，表示报文不需要进行GRO合并*/
id = ntohl(*(u32 *)&iph->id);
flush = (u16)((ntohl(*(u32 *)iph) ^ skb_gro_len(skb)) |
(id ^ IP_DF));
id >>= 16;
/*循环gro_list上缓存的报文进行匹配，设置same 和 flush字段*/
for (p = *head; p; p = p->next)
{
struct iphdr *iph2;
/*如果same字段在链路层没进行设置，
*表示该报文网络层不用进行匹配，直接跳过
*/
if (!NAPI_GRO_CB(p)->same_flow)
continue;
iph2 = ip_hdr(p);
/*如果不符合IPv4的匹配规则，就清除same位，
*告诉传输层不再跟该报文进行匹配
*/
if ((iph->protocol ^ iph2->protocol) |
(iph->tos ^ iph2->tos) |
(iph->saddr ^ iph2->saddr) |
(iph->daddr ^ iph2->daddr))
{
NAPI_GRO_CB(p)->same_flow = 0;
continue;
}
/*如果两个报文ttl不相同或id 不连续，就设置flush位*/
/* All fields must match except length and checksum. */
NAPI_GRO_CB(p)->flush |=
(iph->ttl ^ iph2->ttl) |
((u16)(ntohs(iph2->id) + NAPI_GRO_CB(p)->count) ^ id);
NAPI_GRO_CB(p)->flush |= flush;
}
NAPI_GRO_CB(skb)->flush |= flush;
/*设置传输层要读取的GRO数据的偏移量，其实就是到传输层头的偏移量*/
skb_gro_pull(skb, sizeof(*iph));
/*设置传输层头指针*/
skb_set_transport_header(skb, skb_gro_offset(skb));
/*调用传输层的GRO接收函数*/
pp = ops->gro_receive(head, skb);
out_unlock:
rcu_read_unlock();
out:
NAPI_GRO_CB(skb)->flush |= flush;
return pp;
}

IP层的GRO完成处理函数：
static int inet_gro_complete(struct sk_buff *skb)
{
const struct net_protocol *ops;
struct iphdr *iph = ip_hdr(skb);
int proto = iph->protocol & (MAX_INET_PROTOS - 1);
int err = -ENOSYS;
__be16 newlen = htons(skb->len - skb_network_offset(skb));
/*重新计算并更新IP头的校验和*/
csum_replace2(&iph->check, iph->tot_len, newlen);
iph->tot_len = newlen;
rcu_read_lock();
/*找到传输层协议的GRO完成函数进行进一步的处理*/
ops = rcu_dereference(inet_protos[proto]);
if (WARN_ON(!ops || !ops->gro_complete))
goto out_unlock;
err = ops->gro_complete(skb);
out_unlock:
rcu_read_unlock();
return err;
}

阅读(1831) | 评论(0) | 转发(0) |

上一篇：Linux网络子系统中链路层中GRO的处理

下一篇：一、桥接及二层转发

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6