全部博文(65)
分类: LINUX
2010-06-04 17:47:13
级别: 中级
Ian Shields, Senior Programmer, IBM
2009 年 11 月 16 日
您是不是认为流和管道让 Linux® 专家听起来像管道工?现在您就有机会了解流和管道以及如何重定向和分离流。您甚至还将了解如何将流转变成命令参数。您可以为准备 Linux 系统管理员认证考试 LPI® 101 而学习本文,也可以仅仅是为了从中获得乐趣。
|
本文帮助您巩固重定向标准 I/O 流的基础 Linux 技术。您将学习如何:
本文帮助您准备 Linux Professional Institute's Junior Level Administration (LPIC-1) 考试 101 的主题 103 下的考核目标 103.4。该考核目标的权值为 4。
|
在本文中,我们将使用在文章 “学习 Linux,101:文本流和过滤器” 中创建的一些文件练习命令。即使您没有阅读那篇文章或者没有保存所创建的文件,也一样能顺利学习本文。我们首先在您的主目录下创建一个名为 lpi103-4 的子目录并在其中创建必要的文件。为此,在作为当前目录的主目录下打开一个文本窗口,将清单 1 中的内容复制到文本窗口并运行命令。完成之后就创建了您将要使用的 lpi103-4 子目录和文件。
|
您的窗口应该类似于清单 2,并且当前的目录为新创建的 lpi103-4 目录。
|
|
Linux shell(比如 Bash)接收或发送序列和字符串流 形式的输入或输出。每个字符都独立于与之相邻的字符。字符没有被组织成结构化记录或固定大小的块。不管实际的字符串流进入或来自文件、键盘、显示窗口或其 他 I/O 设备,都使用文件 I/O 技术来访问流。Linux shell 使用 3 种标准的 I/O 流,每种流都与一个文件描述符相关联:
输入流通常通过终端击键为程序提供输入。输出流通常向终端输出文本字符。最初的终端是 ASCII 打字机或显示终端,但现在更多是指图形桌面上的文本窗口。
如果您已经学习了文章 “学习 Linux,101:文本流和过滤器”,那么就熟悉本文的部分内容。
可以通过两种方法将输出重定向到文件:
在 n> 或 n>> 中的 n 引用文件描述符。如果省略它,将执行标准输出。清单 3 在我们先前在 lpi103-4 目录中创建的文件中使用重定向将标准输出和标准错误从 ls
命令分离出来。我们还显示将输出附加到现有文件中。
|
使用 n> 的输出重定向通常覆盖现有的文件。您可以使用 set
内置控件的 noclobber
选项对此进行控制。如果该选项已经设置,您可以使用 n>| 覆盖它,如清单 4 所示。
|
在
某些情况下,您可能想要将标准输出和标准错误都重定向到一个文件中。这通常为自动进程或后台作业而执行的,以便以后可以查看输出。使用
&> 或 &>> 同时将标准输出和标准错误重定向到同一个文件中。另一种方法是,首先重定向文件描述符 n,然后使用 m>&n 或 m>>&n 将文件描述符 m 重定向到同一个文件。例如,
command 2>&1 >output.txt
不同于
command >output.txt 2>&1
在
第一种情况中,stderr 被重定向到 stdout 的当前位置,然后在将 stdout 重定向到 output.txt,但第二次重定向仅影响
stdout,不影响 stderr。在第二种情况中,stderr 被重定向到 stdout 的当前位置,即 output.txt。我们在清单
5 中显示了这些重定向。注意,在最后一个命令中先重定向标准错误在重定向标准输出,所以标准错误输出仍然打印在终端窗口中。
|
不过,有时候您可能想要完全忽略标准输出或标准错误。为此,将选择的流重定向到空文件 /dev/null。清单 6 显示了如何从 ls
命令忽略错误输出,同时也使用 cat
命令显示 /dev/null 是空的。
|
就像可以重定向 stdout 和 stderr 流一样,我们也可以使用 < 操作符从文件重定向 stdin。如果您已经学习了文章 “学习 Linux,101:文本流和过滤器”,那么您可能还会记得我们在 sort 和 uniq 小节中使用 tr
命令将 text1 文件中的空格替换成制表符。在那个例子中我们使用来自 cat
命令的输出为 tr
命令创建标准输入。现在,我们没有必要调用 cat
,而是使用输入重定向将空格转换成制表符,如清单 7 所示。
|
Shell(包括 bash)还有存在 here-document 的概念,它是另一种输入重定向形式。它将 << 和一个单词(比如 END)结合构成一个标记,用来表示输入端。我们在清单 8 中对此进行演示。
|
您可能很想知道可不可以仅输入 sort -k2
和数据,然后按 Ctrl-d
表明输入端。最简单的答案是,您可以这样做,但您必须先了解 here-documents。详细的答案是,here-documents 通常用于
shell 脚本(脚本没有其他方式能够表明应该将脚本的哪一行看作输入)。因为 shell 脚本通过广泛使用制表符来提供缩进,所以
here-documents 还有另一个特点。如果您使用 <<- 而不是 <<,那么将消除前面的制表符。
在清单 9 中,我们使用命令行替换创建了一个强制制表符,然后创建了一个包含两个 cat
命令的 shell 脚本,这两个命令都从 here-document 读取数据。注意,我们使用 END 作为从终端读取的
here-document 的标记。如果我们在该脚本中也使用 END 作为标记,将导致提前结束输入。因此我们使用 EOF
作为标记。在创建好脚本之后,我们使用点号 .
命令导入它,即在当前的 shell 上下文中运行它。
|
在本系列的后续文章中,我们将更详细地介绍命令替换和脚本。查看我们的 学习 Linux,101:LPIC-1 路线图 获得本系列所有文章的简介和链接。
|
在文章 吧学习 Linux,101:文本流和过滤器” 中,我们这样描述文本过滤:接收文本输入流并对文本执行一些转换,然后在发送到输出流的过程。这种过滤通常是通过构造命令管道线 来完成的,其中来自一个命令的输出被导入 或重定向 为下一个命令的输入。管道的这种使用方式并不局限于文本流,尽管这是它的最常见用法。
在
两个命令之间使用管道 | 操作符将的一个命令的 stdout 指向第二个命令的
stdin。您可以通过添加更多的命令和管道操作符来构造更长的管道线。任何命令都可能包含选项或参数。许多命令使用连字符 (-)
取代文件名作为一个参数,用于表示输入来自 stdin
而不是文件。查看手册页确保正确使用命令。构造由多个命令(每个命令都有特定的功能)组成的长管道线是在 Linux 和 UNIX®
中用于完成任务的常见方法。在清单 10 的假设管道线中,command2
和 command3
都带有参数,但 command3
仅使用 -
参数表示来自 stdin 的输入。
|
需要说明的是,管道线仅将 stdout 导向 stdin。您不能使用 2| 单独导出 stderr,至少使用我们目前所了解的工具还不能这样做。如果 stderr 已被重定向到 stdout,那么两个流都会被通过管道导出。在清单 11 中,我们展示了一个不太现实的 ls
命令,它有 4 个不是按字母顺序出现的通配符参数,然后使用一个管道对包含正常和错误输出内容的进行分类。
|
Linux 和 UNIX 系统中的管道的优点之一是,与其他流行的操作系统不同,它们的管道不涉及到中间文件。第一个命令的 stdout 没有写到一个文件中,然后再由第二个命令读取。在文章 “学习 Linux,101:文件和目录管理” 中,您学习了如何使用 tar
命令在一个步骤中归档和压缩文件。即使您使用的 UNIX 系统的 tar
命令不支持使用 -z
(gzip)或 -j
(bzip2)进行压缩也不成问题。您可以使用这样的管道
bunzip2 -c somefile.tar.bz2 | tar -xvf -
完成该任务。
在以上的管道线中,我们在开始时使用一些生成输出的命令,然后通过管道线的每个阶段导出输出。如果我们要以现有的文件开始,应该怎么办呢?许多命令都接受 stdin 或文件作为输入,因此这不成问题。如果您有要求来自 stdin 的输出的过滤器,那么可以考虑使用 cat
命令将文件复制到 stdout。不过,您可以对第一个命令使用输入重定向,然后在剩余的管道下中导出该命令的输出,这是更加常见的解决方案。仅需使用 < 操作符将第一个命令的 stdin 重定向到需要处理的文件。
|
在前面对管道线的讨论中,您学习了如何接受一个命令的输出,并将它用作另一个命令的输入。反过来,假设您想将一个命令或文件的内容作为另一个命令的参数而不是输入。管道线不能用于实现该目的。三种常见的解决办法是:
xargs
命令-exec
选项的 find
命令您将首先了解第一个解决办法。我们曾经在清单 9 中创建了一个强制制表符,您可以从中看到命令替换的例子。可以在命令行上使用命令替换,但在脚本中使用它则更常见;您将在本系列的后续文章中更多地了解它和脚本。查看我们的 学习 Linux,101:LPIC-1 路线图 获得本系列所有文章的简介和链接。
xargs
命令读取标准的输入,然后使用参数作为输入构建和执行命令。如果没有给出命令,那么将使用 echo
命令。清单 12 是使用我们的 text1 文件的基础例子,它包含 3 个行,每行只有两个单词。
|
为什么 xargs
只有一行输出?默认情况下,xargs
在空格处中断输出,并且每个生成的标记都成为一个参数。不过,当 xargs
构建命令时,它将一次传递尽可能多的参数。您可以使用 -n
覆盖该行为,或使用 --max-args
参数。在清单 13 中,我们使用了这两种方法,并为使用 xargs
添加一个显式的 echo
调用。
|
如果输入包含由单引号或双引号保护的空格,或使用了斜杠进行转义,那么 xargs
将不在遇到这些空格时中断。清单 14 显示了这些空格点。
|
到目前为止,已经在命令的末尾添加了所有参数。如果您需要在这些参数后面再使用其他参数,可以使用 -I
选项指定一个替换字符串。如果 xargs
将要执行的命令包含有替换字符串,那么将使用参数替换它。进行了替换之后,仅将参数传递给每个命令。不过,将从一整行输出创建参数,而不仅是一个标记。您还可以使用 xargs
的 -L
选项让命令将行当作参数看待,而不是默认的以单个空格分隔的标记。使用 -I
选项表示 -L 1
。清单 15 显示了使用 -I
和 -L
选项的例子。
|
尽管我们的例子为了便于演示使用了简单的文本文件,您很少看到包含这样的输入的 xargs
。您通常需要处理某些命令生成的大量文件,这些命令包括 ls
、find
或 grep
。清单 16 显示了一种通过 xargs
将目录清单传递到命令(比如 grep
)的方法。
|
如果上一个例子中的一个或多个文件名包含空格,那么会发生什么呢?如果您像清单 16 那样使用该命令,那么将得到一个错误。在实际情况中,文件列表可能来自一些源,比如定制脚本或命令,而不是 ls
,或者您希望通过其他管道线阶段传递它,以进一步进行过滤。所以您应该使用 grep "1" *
取代以上构造。
对于 ls
命令,您可以使用 --quoting-style
选项强制给导致问题的文件名加上引号或进行转义。另外一种更好的解决办法是使用 xargs
的 -0
选项,从而使用 null 字符串 (\0) 分隔输入参数。尽管 ls
没有提供使用 null 字符串分隔的文件名作为输出的选项,但许多命令都提供这样的选项。
在清单 17 中,我们首先将 text1 复制到 “text 1”,然后显示一些在 xargs
命令中使用包含空格的文件名列表的方法。这些示例仅为了演示概念,因为 xargs
可能更加复杂。尤其是在最后一个例子中, 如果一些文件名已经包含新行字符串,那么将新行字符串转换成 null 字符串将导致错误。在本文的下一个部分中,我们将查看另外一个更加健壮的解决方案,即使用 find
命令生成合适的以 null 字符串分隔的输出。
|
xargs
命令不会构建任意长度的命令。在 Linux 内核 2.26.3 之前,命令的长度是受限制的。针对某个包含大量名称很长的文件的目录的命令,比如 rm somepath/*
,可能会失败,返回的消息表明参数列表太长。在更旧的 Linux 系统或 UNIX 系统上仍然存在该限制,因此了解如何使用 xargs
以处理这种问题非常有用。
您可以使用 --show-limits
选项显示 xargs
的默认限制,然后使用 -s
选项将输出命令的长度限制在允许的最大字符串数量之内。查看手册页了解其他未能再次讨论的选项。
在文章 “学习 Linux,101:文件和目录管理” 中,您学习例如如何使用 find
命令根据名称、修改时间、大小或其他特征查找文件。找到匹配的文件集之后,您通常希望对它们执行某些操作:删除、移动和重命名它们等。现在我们看一下 find
命令的 -exec
选项,其功能类似于使用 find
并通过管道将输出指向 xargs
。
|
与前面学习的 xargs
命令相比,它有几个不同之处。
尝试运行 find text[12] |xargs cat text3
亲自看看区别在哪里。
现在,我将话题转回到文件名中的空格。在清单 19 中我们尝试使用带有 -exec
的 find
,而不是带有 xargs
的 ls
。
|
到目前为止,一切进展顺利。但是不是缺少了什么?哪个文件包含 grep
找到行?缺少了文件名,因为 find
为每个文件调用 grep
一次,而 grep
非常智能,能够知道您是不是仅提供文件名,您不需要它告诉您是哪个文件。
我们也可以改为使用 xargs
,但我们已经看到了文件名中包含空格时出现的问题。我们还提到 find
可以生成一个以 null 分隔符分隔的文件名列表,这是 -print0
选项所起的作用。新的 find
可能使用加号(+)取代分号(;)作为分隔符,这允许 find
在一次调用命令时传递尽可能多的名称,类似于 xargs
。在这种情况中,仅能使用 {} 一次,并且它必须是该命令的最后一个参数。清单 20 显示了这两种方法。
|
一般而言,两种方法都是有效的,选择哪种方法由您决定。记住,使用管道导出包含未受保护的空格的内容将导致问题,因此如果您要使用管道将输出导出到 xargs
,请使用将 -print0
选项和 find
结合使用,并使用 -0
选项告诉 xargs
接收使用 null 分隔符分隔的输入。其他命令,包括 tar
,也支持使用 -0
选项并用 null 分隔符分隔的输入,因此应该对支持该选项的命令使用它,除非您能确保您的输入列表不会造成问题。
最后,我们介绍对文件列表进行操作。在执行删除或重命名文件等重要操作之前,最好彻底地测试列表和仔细测试命令。进行良好的备份也是非常有价值的。
|
这个小节简单地讨论另一个命令。有时候,您可能希望在屏幕上看到输出,同时保留一个副本。尽管您可以将命令输出重定向到一个窗口中的文件,然后使用 tail -fn1
在另一个屏幕中跟踪输出来实现该目的,但使用 tee
命令要简单得多。
您可以将 tee
和管道一起使用。对标准输出而言,参数是一个或多个文件。-a
选项附加而非覆盖文件。在前面关于管道的讨论中可以看到,必须先将 stderr 重定向到 stdout ,然后再重定向到 tee
,如果您需要同时保存两者的话。清单 21 显示 用于将输出保存到文件 f1 和 f2 中的 tee
。
|
Ian Shields 参与 developerWorks Linux 专区的许多 Linux 项目。他是 IBM 北卡罗莱那州 Research Triangle Park 的一名高级程序员。他于 1973 年作为一名系统工程师加入 IBM 位于澳大利亚堪培拉的子公司。之后,在加拿大蒙特利尔和北卡罗莱那州 RTP 从事通信系统和普及运算。他拥有多项专利。他毕业于 Australian National University,本科学位是纯粹数学和哲学。他拥有北卡罗来纳州立大学的计算机硕士和博士学位。 |