Linux中的curl命令（转载）-yaofang123-ChinaUnix博客

读书使人明智！yaofang123.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

yaofang123

博客访问： 1443145
博文数量： 264
博客积分： 5810
博客等级：大校
技术积分： 3528
用户组：普通用户
注册时间： 2011-03-13 17:15

文章分类

全部博文（264）

我的书单（1）
非技术（24）

新东西（0）

自我学习（11）

产品经理（1）

准爸爸指南（1）

生活篇（3）

时间管理（3）

职业规划（4）

其他（1）
android（0）
groovy（1）
Ruby（0）

Ruby心得（0）
Lua（0）

Lua高级（0）

Lua基础（0）
协议相关（1）
自研课程（1）

研5：安全（1）

研4：数据库存储（0）

研3：协议与网络（0）

研2：系统内核（0）

研1：算法与程序（0）
软件配置（7）

haxproxy（0）

IIS（0）

resin（1）

apache（3）

nginx（3）
IDE相关（6）
WEB前端（20）

CSS（4）

ExtJS（0）

JS技术（16）
虚拟化研究（1）
技术理论（13）

编程语言（2）

NoSQL（3）

key-value（2）

资料集（2）

分布式（3）
网络相关（1）
存储相关（2）
系统架构（17）

我的架构（2）

消息队列（2）

技术架构（3）

运维开发（2）

运维架构（2）

WEB架构（6）
开源软件（17）

squid（0）

SVN（13）

服务器运维（2）

puppet应用（0）

func应用（2）
php开发（7）

框架（5）

php高级应用（0）

php基础（2）
Mysql管理（7）

Mysql基础（3）

优化（3）

系统管理（0）

DBA相关（1）
Java开发（2）
Jsp开发（2）

ibatis（0）

spring（0）

maven（0）
python（62）

twisted框架（0）

python源码笔记（0）

Django精（15）

读书笔记（2）

python模块（3）

python前沿（2）

python源码分享（9）

python应用（14）

python基础（17）
C/C++（0）

C算法（0）

C基础开发（0）
linux相关（19）

rpm及yum（0）

linux命令（5）

酷shell（4）

Bind技术（1）

linux开发（0）

linux管理（9）
未分配的博文（53）

文章存档

2011年（264）

我的朋友

相关博文

Linux中的curl命令（转载）

分类： Python/Ruby

2011-06-24 08:45:25

声明：此文转载至http://hi.baidu.com/yuanhotel/blog/item/032190ec35fa6a3b269791d1.html

Curl是Linux下一个很强大的http命令行工具，其功能十分强大。

1) 二话不说，先从这里开始吧！

$ curl

回车之后，的html就稀里哗啦地显示在屏幕上了 ~

2) 嗯，要想把读过来页面存下来，是不是要这样呢？

$ curl > page.html

当然可以，但不用这么麻烦的！

用curl的内置option就好，存下http的结果，用这个option: -o

$ curl -o page.html

这样，你就可以看到屏幕上出现一个下载页面进度指示。等进展到100%，自然就 OK咯

3) 什么什么？！访问不到？肯定是你的proxy没有设定了。

使用curl的时候，用这个option可以指定http访问所使用的proxy服务器及其端口： -x

$ curl -x 123.45.67.89:1080 -o page.html

4) 访问有些网站的时候比较讨厌，他使用cookie来记录session信息。

像IE/NN这样的浏览器，当然可以轻易处理cookie信息，但我们的curl呢？.....

我们来学习这个option: -D <— 这个是把http的response里面的cookie信息存到一个特别的文件中去

$ curl -x 123.45.67.89:1080 -o page.html -D cookie0001.txt

这样，当页面被存到page.html的同时，cookie信息也被存到了cookie0001.txt里面了

5）那么，下一次访问的时候，如何继续使用上次留下的cookie信息呢？要知道，很多网站都是靠监视你的cookie信息，来判断你是不是不按规矩访问他们的网站的。

这次我们使用这个option来把上次的cookie信息追加到http request里面去： -b

$ curl -x 123.45.67.89:1080 -o page1.html -D cookie0002.txt -b cookie0001.txt

这样，我们就可以几乎模拟所有的IE操作，去访问网页了！

6）稍微等等 ~我好像忘记什么了 ~

对了！是浏览器信息

有些讨厌的网站总要我们使用某些特定的浏览器去访问他们，有时候更过分的是，还要使用某些特定的版本 NND，哪里有时间为了它去找这些怪异的浏览器呢！？

好在curl给我们提供了一个有用的option，可以让我们随意指定自己这次访问所宣称的自己的浏览器信息： -A

$ curl -A "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" -x 123.45.67.89:1080 -o page.html -D cookie0001.txt

这样，服务器端接到访问的要求，会认为你是一个运行在Windows 2000上的 IE6.0，嘿嘿嘿，其实也许你用的是苹果机呢！

而"Mozilla/4.73 [en] (X11; U; Linux 2.2; 15 i686"则可以告诉对方你是一台 PC上跑着的Linux，用的是Netscape 4.73，呵呵呵

7）另外一个服务器端常用的限制方法，就是检查http访问的referer。比如你先访问首页，再访问里面所指定的下载页，这第二次访问的 referer地址就是第一次访问成功后的页面地址。这样，服务器端只要发现对下载页面某次访问的referer地址不是首页的地址，就可以断定那是个盗连了 ~

讨厌讨厌 ~我就是要盗连 ~！！

幸好curl给我们提供了设定referer的option： -e

$ curl -A "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.0)" -x 123.45.67.89:1080 -e "mail.linuxidc.com" -o page.html -D cookie0001.txt

这样，就可以骗对方的服务器，你是从mail.linuxidc.com点击某个链接过来的了，呵呵呵

8）写着写着发现漏掉什么重要的东西了！——- 利用curl 下载文件

刚才讲过了，下载页面到一个文件里，可以使用 -o ，下载文件也是一样。比如，

$ curl -o 1.jpg ~zzh/screen1.JPG

这里教大家一个新的option： -O 大写的O，这么用：

$ curl -O ~zzh/screen1.JPG

这样，就可以按照服务器上的文件名，自动存在本地了！

再来一个更好用的。

如果screen1.JPG以外还有screen2.JPG、screen3.JPG、....、screen10.JPG需要下载，难不成还要让我们写一个script来完成这些操作？

不干！

在curl里面，这么写就可以了：

$ curl -O ~zzh/screen[1-10].JPG

呵呵呵，厉害吧？！ ~

9）再来，我们继续讲解下载！

$ curl -O ~{zzh,nick}/[001-201].JPG

这样产生的下载，就是

~zzh/001.JPG

~zzh/002.JPG

...

~zzh/201.JPG

~nick/001.JPG

~nick/002.JPG

...

~nick/201.JPG

够方便的了吧？哈哈哈

咦？高兴得太早了。

由于zzh/nick下的文件名都是001，002...，201，下载下来的文件重名，后面的把前面的文件都给覆盖掉了 ~

没关系，我们还有更狠的！

$ curl -o #2_#1.jpg ~{zzh,nick}/[001-201].JPG

—这是.....自定义文件名的下载？ —对头，呵呵！

这样，自定义出来下载下来的文件名，就变成了这样：原来： ~zzh/001.JPG —-> 下载后： 001-zzh.JPG 原来： ~nick/001.JPG —-> 下载后： 001-nick.JPG

这样一来，就不怕文件重名啦，呵呵

阅读(1181) | 评论(0) | 转发(1) |

上一篇：yum配置说明

下一篇：rpm包安装时如何更新安装路径

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6