Linux命令之dos2unix - 将DOS格式文本文件转换成UNIX格式
用途说明
dos2unix命令用来将DOS格式的文本文件转换成UNIX格式的(DOS/MAC to UNIX text file
format converter)。DOS下的文本文件是以\r\n作为断行标志的,表示成十六进制就是0D
0A。而Unix下的文本文件是以\n作为断行标志的,表示成十六进制就是
0A。DOS格式的文本文件在Linux底下,用较低版本的vi打开时行尾会显示^M,而且很多命令都无法很好的处理这种格式的文件,如果是个shell
脚本,。而Unix格式的文本文件在Windows下用Notepad打开时会拼在一起显示。因此产生了两种格式文件相互转换的需求,对应的将UNIX格
式文本文件转成成DOS格式的是unix2dos命令。
常用参数
将DOS格式文本文件转换成Unix格式,最简单的用法就是dos2unix直接跟上文件名。
格式:dos2unix file
如果一次转换多个文件,把这些文件名直接跟在dos2unix之后。(注:也可以加上-o参数,也可以不加,效果一样)
格式:dos2unix file1 file2 file3
格式:dos2unix -o file1 file2 file3
上面在转换时,都会直接在原来的文件上修改,如果想把转换的结果保存在别的文件,而源文件不变,则可以使用-n参数。
格式:dos2unix oldfile newfile
如果要保持文件时间戳不变,加上-k参数。所以上面几条命令都是可以加上-k参数来保持文件时间戳的。
格式:dos2unix -k file
格式:dos2unix -k file1 file2 file3
格式:dos2unix -k -o file1 file2 file3
格式:dos2unix -k -n oldfile newfile
注:unix2dos命令的使用方式与dos2unix命令的类似。
使用示例
示例一 DOS格式文本文件在Linux下的表现
现在有一个脚本文件job.sh,是在Linux下用vi编辑的。
[root@jfht ~]# cat
job.sh
#!/bin/sh
date >job.txt
现在把它转换成DOS格式文本文件。
[root@jfht ~]# unix2dos
job.sh
unix2dos: converting file job.sh to DOS format ...
尝试着运行一下。
[root@jfht ~]# ./job.sh
-bash: ./job.sh: 权限不够
[root@jfht ~]# chmod +x
job.sh
[root@jfht ~]# ./job.sh
-bash: ./job.sh: /bin/sh^M: bad interpreter:
没有那个文件或目录
DOS格式的脚本文件时无法解释执行的,因为脚本文件的第一行是用来指定解释器的,Linux系统认为解释器是/bin/sh^M,而不是/bin/sh。
我们来通过Linux下的一些命令来看一下DOS格式文件的真面目。
[root@jfht ~]# cat -v job.sh <== cat
-v可以看到文件中的非打印字符,而不带-v参数的cat命令不行。
#!/bin/sh^M
^M
date >job.txt^M
^M
[root@jfht ~]# hexdump -C
job.sh <== hexdump
-C可以看到文件每个字节的十六进制表示。
00000000 23 21 2f 62 69 6e 2f
73 68 0d 0a 0d
0a 64 61 74 |#!/bin/sh....dat|
00000010 65 20 3e 6a 6f 62 2e
74 78 74 0d 0a 0d 0a
|e >job.txt....|
0000001e
[root@jfht ~]# vi job.sh <==
使用vi打开时可以看到底下有[dos]的格式提示。有些版本vi显示的是行尾为^M。
#!/bin/sh
date >job.txt
~
~
"job.sh" [dos ] 4L, 30C
现在我们把DOS格式改回Unix格式的,看看效果。
root@jfht ~]# dos2unix
job.sh
dos2unix: converting file job.sh to UNIX format ...
[root@jfht ~]# ./job.sh
可以执行了,不再报“-bash: ./job.sh:
/bin/sh^M: bad interpreter: 没有那个文件或目录”这个错了。
[root@jfht ~]#
示例二 dos2unix -k和dos2unix -n的使用示例
[root@jfht ~]# cat
<1.txt
> 1
> 2
> 3
> EOF
[root@jfht ~]# file 1.txt
1.txt: ASCII text
[root@jfht ~]# ls -l
1.txt
-rw-r--r-- 1 root root 6 11-14 09:08 1.txt
[root@jfht ~]# date
2010年 11月 14日 星期日 09:28:42 CST
[root@jfht ~]# unix2dos -k
1.txt <==
保持文件时间戳
unix2dos: converting file 1.txt to DOS format ...
[root@jfht ~]# ls -l
1.txt
-rw-r--r-- 1 root root 9 11-14 09:08 1.txt
[root@jfht ~]# dos2unix -n 1.txt
2.txt <==
将1.txt转换到2.txt
dos2unix: converting file 1.txt to file 2.txt in UNIX format
...
[root@jfht ~]# ls -l 1.txt
2.txt
-rw-r--r-- 1 root root 9 11-14 09:08 1.txt
-rw-r--r-- 1 root root 6 11-14 09:30 2.txt
[root@jfht ~]# file 1.txt
2.txt
1.txt: ASCII text, with CRLF line terminators
2.txt: ASCII text
[root@jfht ~]# cat -v
1.txt
1^M
2^M
3^M
[root@jfht ~]# cat -v
2.txt
1
2
3
[root@jfht ~]#
Linux命令之nl - 给文件加上行号
nl命令在系统中用来计算文件中行号。nl 可以将输出的文件内容自动的加上行号!其默认的结果与 cat -n 有点不太一样, nl 可以将行号做比较多的显示设计,包括位数与是否自动补齐 0 等等的功能。
1.命令格式:
nl [选项]... [文件]...
2.命令参数:
-b :指定行号指定的方式,主要有两种:
-b a :表示不论是否为空行,也同样列出行号(类似 cat -n);
-b t :如果有空行,空的那一行不要列出行号(默认值);
-n :列出行号表示的方法,主要有三种:
-n ln :行号在萤幕的最左方显示;
-n rn :行号在自己栏位的最右方显示,且不加 0 ;
-n rz :行号在自己栏位的最右方显示,且加 0 ;
-w :行号栏位的占用的位数。
-p 在逻辑定界符处不重新开始计算。
3.命令功能:
nl 命
令读取 File 参数(缺省情况下标准输入),计算输入中的行号,将计算过的行号写入标准输出。 在输出中,nl 命令根据您在命令行中指定的标志来计
算左边的行。 输入文本必须写在逻辑页中。每个逻辑页有头、主体和页脚节(可以有空节)。 除非使用 -p 标志,nl 命令在每个逻辑页开始的地方重新
设置行号。 可以单独为头、主体和页脚节设置行计算标志(例如,头和页脚行可以被计算然而文本行不能)。
4.使用实例:
实例一:用 nl 列出 log2012.log 的内容
命令:
nl log2012.log
输出:
[root@localhost test]# nl log2012.log
1 2012-01
2 2012-02
3 ======[root@localhost test]#
说明:
文件中的空白行,nl 不会加上行号
实例二:用 nl 列出 log2012.log 的内容,空本行也加上行号
命令:
nl -b a log2012.log
输出:
[root@localhost test]# nl -b a log2012.log
1 2012-01
2 2012-02
3
4
5 ======[root@localhost test]#
实例3:让行号前面自动补上0,统一输出格式
命令:
输出:
[root@localhost test]# nl -b a -n rz log2014.log
000001 2014-01
000002 2014-02
000003 2014-03
000004 2014-04
000005 2014-05
000006 2014-06
000007 2014-07
000008 2014-08
000009 2014-09
000010 2014-10
000011 2014-11
000012 2014-12
000013 =======
[root@localhost test]# nl -b a -n rz -w 3 log2014.log
001 2014-01
002 2014-02
003 2014-03
004 2014-04
005 2014-05
006 2014-06
007 2014-07
008 2014-08
009 2014-09
010 2014-10
011 2014-11
012 2014-12
013 =======
说明:
nl -b a -n rz 命令行号默认为六位,要调整位数可以加上参数 -w 3 调整为3位。
Linux命令之basename - 获取文件名称
首先使用 --help 参数查看一下。basename命令参数很少,很容易掌握。
$ basename /usr/bin/sort 输出"sort"。
$ basename ./include/stdio.h .h 输出"stdio"。
为basename指定一个路径,basename命令会删掉所有的前缀包括最后一个slash(‘/’)字符,然后将字符串显示出来。
basename命令格式:
basename [pathname] [suffix]
basename [string] [suffix]
suffix为后缀,如果suffix被指定了,basename会将pathname或string中的suffix去掉。
示例:
-
$ basename /tmp/test/file.txt
-
file.txt
-
$ basename /tmp/test/file.txt .txt
-
file
注意点:
1、如果像下面脚本中传递参数给basename,参数为空,basename会将参数左移
2、basename最多接受两个参数,如果设置的参数多于两个,会提示错误。
参考:
以下是一个简单的脚本,测试了一下basename:
-
#!/bin/bash
-
# basename.sh
-
echo Testing basename
-
echo -------------
-
echo "basename \$1/\$2 .txt; suffix is .txt"
-
filename=`basename $1/$2 .txt`
-
echo $filename
-
echo -------------
-
echo "basename ab.c .c; suffix is .c"
-
basename ab.c .c
-
echo "basename ab b; suffix is b"
-
basename ab b
-
echo -------------
-
echo Testing \$\@ and \$\#
-
echo Output \$\@
-
echo $@
-
echo Output \$\#
-
echo $#
-
# end of basename.sh
脚本运行结果:
-
没有参数传递的情况:
-
-
$./basename.sh
-
Testing basename
-
-------------
-
basename $1/$2 .txt; suffix is .txt
-
/
-
-------------
-
basename ab.c .c; suffix is .c
-
ab
-
basename ab b; suffix is b
-
a
-
Testing $@ and $#
-
-------------
-
Output $@
-
-
Output $#
-
0
-
-
传递参数的情况:
-
-
$ ./basename.sh 1.txt 2.txt
-
Testing basename
-
------------
-
basename $1 .txt; suffix is .txt
-
1
-
-------------
-
basename ab.c .c; suffix is .c
-
ab
-
basename ab b; suffix is b
-
a
-
Testing $@ and $#
-
-------------
-
Output $@
-
1.txt 2.txt
-
Output $#
-
2
额外补充:
1、$@
$@ 为传递的参数
2、$#
$# 为传递参数的数量
就像脚本执行后的结果:
-
Testing $@ and $#
-
-------------
-
Output $@
-
1.txt 2.txt
-
Output $#
-
2
3、$?
是shell变量,表示"最后一次执行命令"的退出状态,一般0表示成功,非0数值表示没有成功。
切记:
$?永远表示shell命令最后一次执行后的退出状态,当函数执行完毕后,如果又执行了其它命令,则$?不再表示函数执行后的状态,而表示其它命令的退出状态.
4、$!
代表pid,进程id
5、$$
代表ppid,父进程id
-
$ ./skype &
-
[2] 13549
-
$ echo $!
-
13549
-
$ echo $$
-
13032
-
$ ps -ef | grep skype
-
luck 13549 13032 4 19:19 pts/0 00:00:00 skype
在linux下使用enca命令来查看文本文件的编码
enca用法如下:
enca -L zh_CN file
检查文件的编码
enca -L zh_CN -x
UTF-8 file 将文件编码转换为"UTF-8"编码
enca -L zh_CN -x
UTF-8 file1 file2 如果不想覆盖原文件可以这样
除了有检查文件编码的功能以外,”enca”还有一个好处就是如果文件本来就是你要转换的那种编码,它不会报错,还是会print出结果来,
而”iconv”则会报错。这对于脚本编写是比较方便的事情。
转换单个文件的编码
enca -L none -x
utf-8 index.html