wget-习_霜-ChinaUnix博客

习_霜的ChinaUnix博客

首页　| 　博文目录　| 　关于我

习_霜

博客访问： 227647
博文数量： 35
博客积分： 0
博客等级：民兵
技术积分： 144
用户组：普通用户
注册时间： 2014-08-03 21:00

文章分类

全部博文（35）

unix网络编程（17）
美丽人生（0）
Android（2）

Android Rec（2）
linux Drive（2）
linux Kerne（6）

内核调试（2）
linux CMD（0）
网络（1）

CAN（0）
linux（7）

linux编程（4）

linux命令（3）
未分配的博文（0）

文章存档

2016年（2）

2015年（17）

2014年（16）

我的朋友

相关博文

wget

分类： LINUX

2014-08-03 21:01:45

原文地址：wget 作者：verne91

wget虽然功能强大，但是使用起来还是比较简单的，基本的语法是：wget [参数列表] URL。下面就结合具体的例子来说明一下wget的用法。
    1、下载整个http或者ftp站点。
    wget
    这个命令可以将首页下载下来。使用-x会强制建立服务器上一模一样的目录，如果使用-nd参数，那么服务器上下载的所有内容都会加到本地当前目录。

wget -r
这个命令会按照递归的方法，下载服务器上所有的目录和文件，实质就是下载整个网站。这个命令一定要小心使用，因为在下载的时候，被下载网站指向的所有地址同样会被下载，因此，如果这个网站引用了其他网站，那么被引用的网站也会被下载下来！基于这个原因，这个参数不常用。可以用-l number参数来指定下载的层次。例如只下载两层，那么使用-l 2。

要是您想制作镜像站点，那么可以使用－m参数，例如：wget -m
这时wget会自动判断合适的参数来制作镜像站点。此时，wget会登录到服务器上，读入robots.txt并按robots.txt的规定来执行。

    2、断点续传。
    当文件特别大或者网络特别慢的时候，往往一个文件还没有下载完，连接就已经被切断，此时就需要断点续传。wget的断点续传是自动的，只需要使用-c参数，例如：
    wget -c
    使用断点续传要求服务器支持断点续传。-t参数表示重试次数，例如需要重试100次，那么就写-t 100，如果设成-t 0，那么表示无穷次重试，直到连接成功。-T参数表示超时等待时间，例如-T 120，表示等待120秒连接不上就算超时。

3、批量下载。
如果有多个文件需要下载，那么可以生成一个文件，把每个文件的URL写一行，例如生成文件download.txt，然后用命令：wget -i download.txt
这样就会把download.txt里面列出的每个URL都下载下来。（如果列的是文件就下载文件，如果列的是网站，那么下载首页）

    4、选择性的下载。
    可以指定让wget只下载一类文件，或者不下载什么文件。例如：
    wget -m --reject=gif
    表示下载，但是忽略gif文件。--accept=LIST 可以接受的文件类型，--reject=LIST拒绝接受的文件类型。

    5、密码和认证。
    wget只能处理利用用户名/密码方式限制访问的网站，可以利用两个参数：
    --http-user=USER设置HTTP用户
    --http-passwd=PASS设置HTTP密码
    对于需要证书做认证的网站，就只能利用其他下载工具了，例如curl。

    6、利用代理服务器进行下载。
    如果用户的网络需要经过代理服务器，那么可以让wget通过代理服务器进行文件的下载。此时需要在当前用户的目录下创建一个.wgetrc文件。文件中可以设置代理服务器：
    http-proxy = 111.111.111.111:8080
    ftp-proxy = 111.111.111.111:8080
    分别表示http的代理服务器和ftp的代理服务器。如果代理服务器需要密码则使用：
    --proxy-user=USER设置代理用户
    --proxy-passwd=PASS设置代理密码
    这两个参数。
    使用参数--proxy=on/off 使用或者关闭代理。
    wget还有很多有用的功能，需要用户去挖掘。

附录：

命令格式：
　　wget [参数列表] [目标软件、网页的网址]

　　-V,--version 显示软件版本号然后退出；
　　-h,--help显示软件帮助信息；
　　-e,--execute=COMMAND 执行一个 “.wgetrc”命令

　　-o,--output-file=FILE 将软件输出信息保存到文件；
　　-a,--append-output=FILE将软件输出信息追加到文件；
　　-d,--debug显示输出信息；
　　-q,--quiet 不显示输出信息；
　　-i,--input-file=FILE 从文件中取得URL；

　　-t,--tries=NUMBER 是否下载次数（0表示无穷次）
　　-O --output-document=FILE下载文件保存为别的文件名
　　-nc, --no-clobber 不要覆盖已经存在的文件
　　-N,--timestamping只下载比本地新的文件
　　-T,--timeout=SECONDS 设置超时时间
　　-Y,--proxy=on/off 关闭代理

-nd,--no-directories 不建立目录
　　-x,--force-directories 强制建立目录

--http-user=USER设置HTTP用户
　　--http-passwd=PASS设置HTTP密码
　　--proxy-user=USER设置代理用户
　　--proxy-passwd=PASS设置代理密码

-r,--recursive 下载整个网站、目录（小心使用）
　　-l,--level=NUMBER 下载层次

-A,--accept=LIST 可以接受的文件类型
　　-R,--reject=LIST拒绝接受的文件类型
　　-D,--domains=LIST可以接受的域名
　　--exclude-domains=LIST拒绝的域名
　　-L,--relative 下载关联链接
　　--follow-ftp 只下载FTP链接
　　-H,--span-hosts 可以下载外面的主机
　　-I,--include-directories=LIST允许的目录
　　-X,--exclude-directories=LIST 拒绝的目录

阅读(1723) | 评论(0) | 转发(0) |

上一篇：没有了

下一篇：用wget做站点镜像

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6