全部博文(64)
分类: Python/Ruby
2009-09-21 15:37:02
很多类型的文件其文件起始的几个字节的内容是固定的(或是有意填充,或是本就如此)。因此这几个字节的内容也被称为魔 数 (magic number,还有别的意思),因为根据这几个字节的内容就可以确定文件类型。例如 FreeBSD 上 ELF 文件的 magic number 就是文件的前四个字节依次为"7f 45 4c 46",对应的ascii字符串即 "^?ELF"。tar 文件的 magic number 是从第257个字节起为 "ustar"。Unix 命令 "file" 应该就是利用这个原理工作的。
#!
#!
应该也算是一个魔数,当系统(不是 shell)读到文件头两字节的内容为 #!
时就知道该调用指定的程序来解释执行这个脚本。这也解释了为什么 #!
只有在文件的头两个字节才生效,否则被当成普通注释。依我看选择 #!
还是很有道理的:
#!
这一行就会自动被脚本语言的解释器忽略掉。
可以想象,系统遇到 #!
的处理过程肯定是先将 #!
之后的内容按空格分解,然后调用 exec 函数中某一种。分解后的得到第一个元素作为可执行程序名传给 exec ,剩下的和命令行参数都作为参数转给。所以实际上 #!
指定的不必是某个脚本语言解释器,任何能正确处理参数的程序都行。
$ cat test.sh
#!/bin/cat
$ ./test.sh
#!/bin/cat
$ cat hello.txt
Hello
$ ./test.sh hello.txt
#!/bin/cat
Hello
$ cat test1.sh
#!/bin/ls -l
$ ./test1.sh
-rwxr-xr-x 1 lungangf 4294967295 14 Mar 22 12:35 ./test1.sh
前不久有同事的脚本表面上看完全正确,但运行时却报如下错误(redhat 2.4.21):
$ ./test.sh
: bad interpreter: No such file or directory
我用Emacs打开脚本文件,发现Emacs的mode-line上提示该文件为DOS格式,即换行符实际上由回车+换行组成。把文件转成unix格式后再运行,错误消失。经过多次试验发现在solaris和linux上都类似的规律:
如果脚本指定了脚本解释器(第一行形如“#!/bin/bash”),脚本的格式(DOS/Unix)必须正确;否则,脚本的换行格式无所谓,或者说bash对两种格式都认。
例如(bad.sh和ok.sh均为DOS格式):
$ cat bad.sh
#!/bin/bash
echo "hello1"
echo "hello2"
$ ./bad.sh
: bad interpreter: No such file or directory
$ cat ok.sh
echo "ok1"
echo "ok2"
$ ./ok.sh
ok1
ok2
有了之前的铺垫,这个原因就比较清楚了。DOS格式文件的换行实际上是两个字符:回车(\r,通常显示成 ^M) + 换行 (\n),而 Unix 系统把 '\r' 当成一个普通字符处理,所以认为要执行的程序是 "/bin/bash^M",这个自然要报错。如果在行尾加上几个空格,那 ^M 就被当成参数了。在 FreeBSD 上错误提示相对就比较清楚一些:
[lgfang@lgfang ~/tmp]$ ./test.sh
-bash: ./test.sh: /usr/local/bin/bash^M: bad interpreter: No such file
or directory
[lgfang@lgfang ~/tmp]$ ./test1.sh
: No such file or directory