wget的使用形式是:
wget [参数列表] URL
首先来介绍一下wget的主要参数:
· -b:让wget在后台运行,记录文件写在当前目录下"wget-log"文件中;
· -t [nuber of times]:尝试次数,当wget无法与服务器建立连接时,尝试连接多少次
。比如"-t
120"表示尝试120次。当这一项为"0"的时候,指定尝试无穷多次直到连接成功为止,这个
设置非常有用,当对方服务器突然关机或者网络突然中断的时候,可以在恢复正常后继续
下载没有传完的文件;
· -c:断点续传,这也是个非常有用的设置,特别当下载比较大的文件的时候,如果中
途意外中断,那么连接恢复的时候会从上次没传完的地方接着传,而不是又从头开始,使
用这一项需要远程服务器也支持断点续传,一般来讲,基于UNIX/Linux的Web/FTP服务器
都支持断点续传;
· -T [number of seconds]:超时时间,指定多长时间远程服务器没有响应就中断连接
,开始下一次尝试。比如"-T
120"表示如果120秒以后远程服务器没有发过来数据,就重新尝试连接。如果网络速度比
较快,这个时间可以设置的短些,相反,可以设置的长一些,一般最多不超过900,通常
也不少于60,一般设置在120左右比较合适;
· -w [number of seconds]:在两次尝试之间等待多少秒,比如"-w 100"表示两次尝试
之间等待100秒;
· -Y on/off:通过/不通过代理服务器进行连接;
· -Q [byetes]:限制下载文件的总大小最多不能超过多少,比如"-Q2k"表示不能超过2K
字节,"-Q3m"表示最多不能超过3M字节,如果数字后面什么都不加,就表示是以字节为单
位,比如"-Q200"表示最多不能超过200字节;
· -nd:不下载目录结构,把从服务器所有指定目录下载的文件都堆到当前目录里;
· -x:与"-nd"设置刚好相反,创建完整的目录结构,例如"wget -nd
"将创建在当前目录下创建""子目录,然后按照服务器
实际的目录结构一级一级建下去,直到所有的文件都传完为止;
· -nH:不创建以目标主机域名为目录名的目录,将目标主机的目录结构直接下到当前目
录下;
· --http-user=username
· --http-passwd=password:如果Web服务器需要指定用户名和口令,用这两项来设定;
· --proxy-user=username
· --proxy-passwd=password:如果代理服务器需要输入用户名和口令,使用这两个选项
;
· -r:在本机建立服务器端目录结构;
· -l [depth]:下载远程服务器目录结构的深度,例如"-l 5"下载目录深度小于或者等
于5以内的目录结构或者文件;
· -m:做站点镜像时的选项,如果你想做一个站点的镜像,使用这个选项,它将自动设
定其他合适的选项以便于站点镜像;
· -np:只下载目标站点指定目录及其子目录的内容。这也是一个非常有用的选项,我们
假设某个人的个人主页里面有一个指向这个站点其他人个人主页的连接,而我们只想下载
这个人的个人主页,如果不设置这个选项,甚至--有可能把整个站点给抓下来,这显然是
我们通常不希望的;
ü 如何设定wget所使用的代理服务器
wget可以使用用户设置文件".wgetrc"来读取很多设置,我们这里主要利用这个文件来是
设置代理服务器。使用者用什么用户登录,那么什么用户主目录下的".wgetrc"文件就起
作用。例如,"root"用户如果想使用".wgetrc"来设置代理服务器,"/root/.wgert"就起
作用,下面给出一个".wge
trc"文件的内容,读者可以参照这个例子来编写自己的"wgetrc"文件:
http-proxy = 111.111.111.111:8080
ftp-proxy = 111.111.111.111:8080
这两行的含义是,代理服务器IP地址为:111.111.111.111,端口号为:80。第一行指定
HTTP协议所使用的代理服务器,第二行指定FTP协议所使用的代理服务器。
====================================================
Wget 的用法
-V 版本信息
-h 帮助信息
-b 后台执行Wget
-o filename 把记录放在文件filename
-a filename 把记录附加在文件filename
-d 显示调试信息
-q 无输出下载方式
-v 详细的屏幕输出(默认)
-nv 简单的屏幕输出
-i inputfiles 从文本文件内读取地址列表
-F forcehtml 从html文件内读取地址列表
-t number number次重试下载(0时为无限次)
-O output document file 写文件到文件
-nc 不覆盖已有的文件
-c 断点下传
-N 时间时间戳。该参数指定wget只下载更新的文件,也就是说,与本地目录中的对应文件的长度和最后修改日期一样的文件将不被下载。
-S 显示服务器响应
-T timeout 超时时间设置(单位秒)
-w time 重试延时(单位秒)
-Y proxy=on/off 是否打开代理
-Q quota=number 重试次数
目录:
-nd --no-directories 不建立目录.
-x, --force-directories 强制进行目录建立的工作.
-nH, --no-host-directories 不建立主机的目录.
-P, --directory-prefix=PREFIX 把档案存到 PREFIX/...
--cut-dirs=NUMBER 忽略 NUMBER 个远端的目录元件.
HTTP 选项:
--http-user=USER 设 http 使用者为 USER.
--http0passwd=PASS 设 http 使用者的密码为 PASS.
-C, --cache=on/off 提供/关闭快取伺服器资料 (正常情况为提供).
--ignore-length 忽略 `Content-Length' 标头栏位.
--proxy-user=USER 设 USER 为 Proxy 使用者名称.
--proxy-passwd=PASS 设 PASS 为 Proxy 密码.
-s, --save-headers 储存 HTTP 标头成为档案.
-U, --user-agent=AGENT 使用 AGENT 取代 Wget/VERSION 作为识别代号.
FTP 选项:
--retr-symlinks 取回 FTP 的象徵连结.
-g, --glob=on/off turn file name globbing on ot off.
--passive-ftp 使用 "passive" 传输模式.
使用递回方式的取回:
-r, --recursive 像是吸入 web 的取回 -- 请小心使用!.
-l, --level=NUMBER 递回层次的最大值 (0 不限制).
--delete-after 删除下载完毕的档案.
-k, --convert-links 改变没有关连的连结成为有关连.
-m, --mirror 开启适合用来映射的选项.
-nr, --dont-remove-listing 不要移除 `.listing' 档.
递回式作业的允许与拒绝选项:
-A, --accept=LIST 允许的扩充项目的列表
. -R, --reject=LIST 拒绝的扩充项目的列表.
-D, --domains=LIST 允许的网域列表.
--exclude-domains=LIST 拒绝的网域列表 (使用逗号来分隔).
-L, --relative 只跟随关联连结前进.
--follow-ftp 跟随 HTML 文件里面的 FTP 连结.
-H, --span-hosts 当开始递回时便到外面的主机.
-I, --include-directories=LIST 允许的目录列表.
-X, --exclude-directories=LIST 排除的目录列表.
-nh, --no-host-lookup 不透过 DNS 查寻主机.
-np, --no-parent 不追朔到起源目录.
wget -t0 -c -nH -np -b -m -P /localdir
-o wget.log
今天用wget一看那么多的命令,先把它翻译了一下,再到外边搜到一些相关内容.
阅读(2065) | 评论(0) | 转发(0) |