以下是我请求一个pdf文件的请求报文与响应报文的头部信息。可以看到如何完成http请求一个pdf的完整的过程,整个pdf总共223,652 字节,由抓到的数据包可以分析出这个文件被服务器通过两个http响应完成。第一个请求请求了32KB,剩下的一个请求完成了剩下的190884Byte的文件。由于第一次GET请求并不知道请求的文件是多少,只有在第一个响应头部分析出这个文件是多大。并请求剩下的文件数据,而后浏览器对文件进行合并。
-
GET /maindoc/Varnish_cache.pdf HTTP/1.1
-
-
Host: yaoweibin.cn
-
-
Connection: keep-alive
-
-
User-Agent: Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/30.0.1599.101 Safari/537.36
-
-
Accept: */*
-
-
Referer:
-
-
Accept-Encoding: gzip,deflate,sdch
-
-
Accept-Language: zh-CN,zh;q=0.8
-
-
Cookie: __cfduid=d616785c680fd944ee413a8817667c3a51389705653453
-
-
Range: bytes=0-32767
-
以下是HTTP的响应报文。由响应报头可知,断点续传是通过Content-Range字段来完成的。HTTP的response header中的206表示传送的是一个大文件,并没有传送完,一个218KB的文件通过两个HTTP的响应来完成。也就是说整个文件是分块传输的。
-
HTTP/1.1 206 Partial Content
-
Server: cloudflare-nginx
-
Date: Wed, 29 Jan 2014 01:36:21 GMT
-
Content-Type: application/pdf
-
Content-Length: 32768
-
Connection: keep-alive
-
Last-Modified: Mon, 29 Apr 2013 07:27:12 GMT
-
CF-Cache-Status: HIT
-
Vary: Accept-Encoding
-
Expires: Wed, 29 Jan 2014 05:36:21 GMT
-
Cache-Control: public, max-age=14400
-
Content-Range: bytes 0-32767/223652
-
CF-RAY: f4230e866050293
我们也可以通过curl命令模拟http请求完成断点续传文件,然后将生成的两个文件利用cat 命令合并生成下载的文件。
-
curl --header "Range: bytes=0-20000" yaoweibin.cn/maindoc/Varnish_cache.pdf -o part1
-
-
curl --header "Range: bytes=20001-223651" yaoweibin.cn/maindoc/Varnish_cache.pdf -o part2
-
-
cat part1 part2 >> a.pdf
阅读(1185) | 评论(0) | 转发(0) |