增量式修改检验和（IP, TCP, UDP）算法的研究和实现-zhanglin496-ChinaUnix博客

mxl&nbsp;ChinaUnix博客zhanglin.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zhanglin496

博客访问： 1029212
博文数量： 442
博客积分： 1146
博客等级：少尉
技术积分： 1604
用户组：普通用户
注册时间： 2010-11-04 12:52

个人简介

123

文章分类

全部博文（442）

RCU机制（2）
tc流量控制（2）
ipv6（1）
内核启动流程（5）
openwrt（7）
bootloader（3）
http（1）
C++（3）
网络概念（0）
多线程编程（2）
常用算法（14）
linux操作（9）
内核同步（26）

内存屏障（5）
linux内核（191）

RCU机制（3）

netfilter-nat分（3）

skb解析（5）

定时器实现（1）

poll分析（4）

proc系统（5）

linux-IPC（13）

netfilter（84）

linux数据结构（17）

linux驱动（11）
git（3）
linux配置（7）
个人经验总结（6）
调试（7）
Unix C（40）
TCP/IP（26）
未分配的博文（87）

文章存档

2017年（3）

2016年（15）

2015年（132）

2014年（52）

2013年（101）

2012年（110）

2011年（29）

我的朋友

相关博文

增量式修改检验和（IP, TCP, UDP）算法的研究和实现

分类： LINUX

2015-06-11 10:26:19

原文地址：增量式修改检验和（IP, TCP, UDP）算法的研究和实现作者：Godbach

/*
* Author: Godbach
* E-mail:nylzhaowei@163.com
* 本文可以自由转载，但请标明出处，并保证本文的完整性。
*/
对于数据包中检验和的计算，很多讲TCP/IP协议的书中都讲过，RFC1071是讨论计算检验和的文档。传统的计算方法都是需要将整个数据报文的数据（IP报文是计算IP头部的数据）进行反码求和。

但在实际的应用中，存在对收到的数据包进行修改若干个地方，并回送至发送方或者转发的情况。这个时候，就涉及的重新计算数据包的检验和。最常见的可能就是，将收到的数据包的TTL字段减1，并转发的情况。如果仍旧按照传统的计算检验和的方式进行计算，特别是当数据包长度很大时，为了重新计算校验和而将整个数据包的数据遍历一边，反码求和，效率肯定比较低。

一、增量修改检验和的实现

解决的方法就是采用增量式修改检验和的方法。该方法是由RFC1141提出的。这里进行以下简单的变通，将增量式修改检验和的公式列出来：
HC -- 数据包中旧的检验和
HC'-- 数据包中新的检验和
m -- 数据包中某个域(16-bit字)修改前的值
m' -- 数据包中某个域(16-bit字)修改后的值

那么，修改某个域之后的校验和HC'与HC，m 和m'的关系如下：
HC' = HC + m + ~m' （公式1）

具体实现的C代码如下：

/*implemented according with RFC 1071 and 1141*/ static unsigned short csum_incremental_update(unsigned short old_csum, unsigned short old_field, unsigned short new_field) { unsigned long csum = old_csum + old_field + (~new_field & 0xFFFF); csum = (csum >> 16) + (csum & 0xFFFF); csum += (csum >> 16); return csum; }

这个时候，如果修改了IP头部的TTL值，将取修改前的TTL域所在的16-bit字的值为old_field, 修改后的为new_field, 并取出就得检验和old_csum，通过调用该函数即可计算出新的检验和。
当然该函数每次只能计算一个16-bit字，如果对数据包中修改了过多的16-bit字，那么它的性能将会如何呢。

用TCP数据包做测试。而且该TCP数据包为三次握手时的数据包，仅有头部，没有数据部分。对该数据包修改了8个不同的16-bit字，调用该函数8次所需的时间仍旧不到传统计算方法的一半。可见，效果适合明显的。

二、增量修改检验和的完善
1.RFC1071和1141所提出的增量式修改检验有一个BUG，就是按照公式1计算新的检验和时，有可能出现计算结果为0xFFFF的情形，可以参看 RFC1624给出的例子。如果检验和为0xFFFF,则意味着数据包中所有部分相加的结果为0x0000。这是不可能的。因此，RFC1624提出了对这个BUG的改进方法，见公式2：
HC' = ~(~HC + ~m + m') （公式2）
公式2先对旧的检验和和某个域的值取反，加上新的域值之后，将整体的和再次取反得出新的检验和。
具体实现的C代码如下：

/*implemented according with RFC 1624, modified the algorithm from RFC 1071 and 1141*/ static unsigned short csum_incremental_update_modified(unsigned short old_csum, unsigned short old_field, unsigned short new_field) { unsigned long csum = (~old_csum & 0xFFFF) + (~old_field & 0xFFFF) + new_field ; csum = (csum >> 16) + (csum & 0xFFFF); csum += (csum >> 16); return ~csum; }

该方法和公式1给出的方法很明显多出了两次取反操作，在效率上并没有公式1的高，这个也经过了实际的测试。
2. 对此，RFC1624又给出了另外一个方法既可以保证修正RFC1071和RFC1141的BUG，又可以保证执行的效率，见公式3：
HC' = HC - ~m - m' （公式3）
公式3采用减法操作代替公示2中的加法操作。
具体实现的AT&T汇编代码如下：

/*incremental update IP ,TCP, UDP checksum, implemented in Assembly according with RFC 1624, used subtraction to update checksum*/ static inline unsigned short csum_incremental_update(unsigned short old_csum, unsigned short old_field, unsigned short new_field) { __asm__ __volatile__( "notw %1; \n" "subw %1, %0; \n" "sbbw %2, %0; \n" "sbbw $0, %0; \n" :"=r" (old_csum) :"r"(old_field), "r"(new_field), "0"(old_csum)); return old_csum; }

经过实际测试，公式3的效率比公式2的效率高了很多，基本上和公示1的效率接近。

以上就是本人关于增量式修改检验和的研究和实现。不妥之处，请多指点。

阅读(1385) | 评论(0) | 转发(0) |

上一篇：spin_lock/unlock和preempt_enable/disable封装历程(1)

下一篇：网络安全设备Bypass功能介绍及分析

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6