全部博文(8)
分类: LINUX
2010-08-31 14:46:41
函数在程序设计中是一个 非常重要的概念,它可以将程序划分成一个个功能相对独立的代码块,使代码的模块化更好,结构更加清晰,并可以有效地减少程序的代码量。递归函数更是充分提 现了这些优点,通过在函数定义中调用自身,可以将复杂的计算问题变成一个简单的迭代算法,当回溯到边界条件时,再逐层返回上一层函数。有很多数学问题都非 常适合于采用递归的思想来设计程序求解,例如阶乘、汉诺(hanoi)塔等。 可能很多人都曾经听说过 fork 炸弹,它实际上只是一个非常简单的递归程序,程序所做的事情只有一样:不断 fork 一个新进程。由于程序是递归的,如果没有任何限制,这会导致这个简单的程序迅速耗尽系统里面的所有资源。 在 bash 中设计这样一个 fork 炸弹非常简单,Jaromil 在 2002 年设计了最为精简的一个 fork炸弹的实现,整个程序从函数定义到调用仅仅包含 13 个字符,如清单 1 所示。 清单1. bash 中的 fork 炸弹 .(){ .|.& };. 这串字符乍看上去根本就看不出个所以然来,下面让我们逐一解释一下它究竟在干些什么。为了解释方便,我们对清单1中的内容重新设置一下格式,并在前面加上了行号,如清单 2 所示。 清单2. bash 中的 fork 炸弹的解释 1 .() 2 { 3 .|.& 4 } 5 ; 6 . 第 1 行说明下面要定义一个函数,函数名为小数点,没有可选参数。 第 2 行表示函数体开始。 第 3 行是函数体真正要做的事情,首先它递归调用本函数,然后利用管道调用一个新进程(它要做的事情也是递归调用本函数),并将其放到后台执行。 第 4 行表示函数体结束。 第 5 行并不会执行什么操作,在命令行中用来分隔两个命令用。从总体来看,它表明这段程序包含两个部分,首先定义了一个函数,然后调用这个函数。 第 6 行表示调用本函数。 对 于函数名,大家可能会有所疑惑,小数点也能做函数名使用吗?毕竟小数点是 shell 的一个内嵌命令,用来在当前 shell 环境中读取指定文件,并运行其中的命令。实际上的确可以,这取决于 bash 对命令的解释顺序。默认情况下,bash 处于非 POSIX 模式,此时对命令的解释顺序如下: 关键字,例如 if、for 等。 别名。别名不能与关键字相同,但是可以为关键字定义别名,例如 end=fi。 特 殊内嵌命令,例如 break、continue 等。POSIX 定义的特殊内嵌命令包括:.(小数点)、:(冒号)、break、continue、eval、exec、exit、export、readonly、 return、set、shift、times、trap 和 unset。bash 又增加了一个特殊的内嵌命令 source。 函数。如果处于非 POSIX 模式,bash 会优先匹配函数,然后再匹配内嵌命令。 非特殊内嵌命令,例如 cd、test 等。 脚本和可执行程序。在 PATH 环境变量指定的目录中进行搜索,返回第一个匹配项。 由 于默认情况下,bash 处于非 POSIX 模式,因此 fork 炸弹中的小数点会优先当成一个函数进行匹配。(实际上,Jaromil 最初的设计并没有使用小数点,而是使用的冒号,也能起到完全相同的效果。)要使用 POSIX 模式来运行 bash 脚本,可以使用以下三种方法: 使用 --posix 选项启动 bash。 在运行 bash 之后,执行 set -o posix 命令。 使用 /bin/sh 。 最 后一种方法比较有趣,尽管 sh 在大部分系统上是一个指向 bash 的符号链接,但是它所启用的却是 POSIX 模式,所有的行为都完全遵守 POSIX 规范。在清单 3 给出的例子中,我们可以发现,小数点在默认 bash 中被解释成一个函数,能够正常执行;但是在 sh 中,小数点却被当作一个内嵌命令,因此调用函数时会被认为存在语法错误,无法正常执行。 清单3. bash 与 sh 对命令匹配顺序的区别 [root@localhost ~]# ls -l /bin/bash /bin/sh -rwxr-xr-x 1 root root 735144 2007-08-31 22:20 /bin/bash lrwxrwxrwx 1 root root 4 2007-12-18 13:26 /bin/sh -> bash [root@localhost ~]# echo $SHELL /bin/bash [root@localhost ~]# .() { echo hello; } ; . hello [root@localhost ~]# sh sh-3.2# echo $SHELL /bin/bash sh-3.2# .() { echo hello; } ; . sh: `.': not a valid identifier sh: .: filename argument required .: usage: . filename [arguments] sh-3.2# 一 旦运行清单 1 给出的 fork 炸弹,会以2的指数次幂的速度不断产生新进程,这会导致系统资源会被迅速耗光,最终除非重新启动机器,否则基本上就毫无办法了。为了防止这会造成太大的损 害,我们可以使用 ulimit 限制每个用户能够创建的进程数,如清单 4 所示。 清单4. 限制用户可以创建的进程数 [root@localhost ~]# ulimit -u 128 [root@localhost ~]# ulimit -a core file size (blocks, -c) 0 data seg size (kbytes, -d) unlimited max nice (-e) 20 file size (blocks, -f) unlimited pending signals (-i) unlimited max locked memory (kbytes, -l) unlimited max memory size (kbytes, -m) unlimited open files (-n) 1024 pipe size (512 bytes, -p) 8 POSIX message queues (bytes, -q) unlimited max rt priority (-r) unlimited stack size (kbytes, -s) 8192 cpu time (seconds, -t) unlimited max user processes (-u) 128 virtual memory (kbytes, -v) unlimited file locks (-x) unlimited [root@localhost ~]# .() { .|.& } ; . [1] 6152 [root@localhost ~]# bash: fork: Resource temporarily unavailable bash: fork: Resource temporarily unavailable bash: fork: Resource temporarily unavailable ... 在清单 4 中,我们将用户可以创建的最大进程数限制为 128,执行 fork 炸弹会迅速 fork 出大量进程,此后会由于资源不足而无法继续执行。 fork 炸弹让我们认识到了递归函数的强大功能,同时也意识到一旦使用不当,递归函数所造成的破坏将是巨大的。实际上,fork 炸弹只是一个非常简单的递归函数,它并不涉及参数传递、返回值等问题,而这些问题在使用 bash 编程时是否有完善的支持呢?下面让我们通过几个例子来逐一介绍在 bash 中编写递归函数时应该注意的相关问题。 |