为什么多TCP连接分块下载比单连接下载快？-hanwei

hanwei_1049

首页　| 　博文目录　| 　关于我

hanwei_1049

博客访问： 1527862
博文数量： 228
博客积分： 1698
博客等级：上尉
技术积分： 3241
用户组：普通用户
注册时间： 2008-12-24 21:49

个人简介

Linux

文章分类

全部博文（228）

进程间通信（4）
LVS（0）
OpenStack（1）
HTTPS（5）
LUA（1）
版本控制（9）
个人计划（2）
Nginx（27）
MySQL（0）
Trouble Sho（2）
HaProxy（1）
进程调度（0）
ATS（31）
CDN（15）
Redis（0）
TCP/IP协议栈（7）
文件系统/存储（3）
内存管理（11）
系统/脚本（4）
编程相关（8）
攻防研究（13）
体系结构（9）
数据结构（0）
内核相关（14）
安全相关（1）
网络相关（43）
未分配的博文（17）

文章存档

2017年（1）

2016年（43）

2015年（102）

2014年（44）

2013年（5）

2012年（30）

2011年（3）

我的朋友

相关博文

为什么多TCP连接分块下载比单连接下载快？

分类： LINUX

2015-03-03 11:50:56

转自：

我观察到，客户端机器从单一服务器使用 HTTP 下载一个文件：
1. 单连接下载，速度没有达到客户端网络的最大带宽；
2. 多连接同时下载，传输速度有极大的提高，带宽被占满。

假设如下前提：
1. 服务器是单一的，没有使用提供相同文件的其它服务器，也没有使用同域名的其它服务器；
2. 服务器不对单个连接限速。

那么，是什么导致多连接下载的速度大为提高呢？换一种说法，是什么原因导致单一 TCP 连接没有尽可能地利用带宽呢？
是因为不同的 TCP 连接使用了不同的链路吗？可是传输层不应该影响网络层的吧？
是因为 TCP 本身的特性吗？那又是怎样的特性导致了这种结果呢？

测试结果：
1. 单连接下载：wget --header='Host: python.org' http://82.94.164.162/ftp/python/3.4.0/Python-3.4.0a3.tar.xz 138 KB/s
2. 多连接下载：aria2c -k 1M -x 16 -s 16 --header='Host: python.org' http://82.94.164.162/ftp/python/3.4.0/Python-3.4.0a3.tar.xz414KiB/s
3. 国外服务器单连接下载： 2.26 MB/s

补充：文件是下载到内存的（tmpfs），因此避开了并发磁盘 I/O 带来的影响。
=============================================================================
TCP特性使得每个TCP连接可以得到均等的带宽。在多用户环境下，一个用户拥有越多TCP连接，获得的带宽越大。

具体来说：

这个涉及到了TCP的拥塞控制。

我们先看一下单TCP连接的拥塞控制。

这是一个TCP连接的发送窗口。

绿色部分为发送者已发送，且接收者已确认（ACKed）。
黄色部分为发送者已发送，但接收者尚未确认（"in-flight"）。
蓝色部分为可用但尚未发送。
灰色部分为不可用。

所以在RTT（round-trip time，来回通讯延迟）不变的情况下，cwnd这个变量基本决定传输速率。
发送者总会试图找到不丢包情况下的最大速率。按照TCP协议，在传输开始之后，每接收到一个确认（ACK)就会把cwnd这个变量增大一倍。所以TCP连接开始之后应该是这个样子。
刚开始的时候传输速率应该是指数被增长的，直到丢包发生。丢包会有两种情况：
1.当接收者发送给发送者的ACK丢失了，这时会触发超时（timeout)。
2.当发送者发送给接收者的数据包丢失了，发送者会收到接收者发来的重复ACK，如果发送者收到了3个重复的ACK，也会认为发生了丢包。

具体对这两种情况采取的措施略有不同，但粗略来说，变量cwnd会被减半，也就是说传输速率减半。然后cwnd会再次增大，直到下次丢包发生。所以忽略最开始，TCP的吞吐量应该是这样。

好，那么现在我们来看多TCP连接的拥塞控制。
我们假设有两条同样的TCP连接。在他们的连接中间有一个共用的瓶颈路由器，带宽为R。
假设这两条连接都需要传输足够大量的数据，那么不论他们谁先开始传输，最后一定会均分带宽。
因为如果总传输速率低于R的时候就会不断增大传输速率，某个连接在增大传输速率的时候发生丢包就会减半传输速率，最后趋于平衡。

所以k条经过同一节点TCP连接会平分带宽R，每条连接得到带宽R/k。

正因为如此，不论是以前的net vampire，还是现在的迅雷都采取增加并发连接数的方法来加快下载速度。

references:

James F. Kurose, Keith W. Ross: Computer Networking: A Top-Down Approach, 6e

======================================================================================
1、2楼的回答都对，问题的关键，其实是在路由器上。

在不存在链路争用的情况下，单连接可以做到和多连接一样快。
例如，我这里局域网用的是百兆交换机，下载文件到内存，可以达到11.3MB/s：
======================================================================================
从我个人的经验，"单连接下载，速度没有达到客户端网络的最大带宽"的原因有二：
1. 服务器端对单个连接的最大带宽做了限制，或者服务器达到IO上限无法按客户最大带宽提供数据。
2. 客户到服务器端的链路不稳定，如果出现丢包的话就极大影响速度，每一次丢包就相当于踩了一脚刹车。

如果上述两个条件都不存在的话，单连接下载，是完全可以达到最大带宽的。
======================================================================================
手机怒答，简单的说，就是tcp的拥塞避免机制完全不适用于现有的网络条件了。
设计tcp的年代，网络带宽很低，所以tcp被设计成一个极度友好的协议，一旦发现拥塞就拼命退让，但是现在的网络已经带宽极大改善了，而网络质量反而极大降低，延迟也大了很多（滑动窗口在大延迟下成了一个很逗比的存在），所以当tcp进行拥塞避免的时候，其实网络根本就没有拥塞，只是质量不好丢了点包而已。结果就是tcp没有办法最大化的利用带宽。

阅读(2453) | 评论(0) | 转发(0) |

上一篇：TCP TIME_WAIT常见解决方法

下一篇：haproxy主要代码

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6