原文地址:http://blog.sina.com.cn/s/blog_3d8529400100gjst.html
1. tr 命令的功能
tr命名是简化了的sed命令。其主要的功能包括:
a. 用一个字符来替换另外一个字符。
b.
删除字符串中的指定子串。
c. 合并字符串中重复串。
2. 常见的命令格式:
tr -c -d -s
["string1_to_translate_from"] ["string2_to_translate_to"] < input-file
-c
用字符串1中字符集的补集替换此字符集,要求字符集为ASCII。
-d 删除字符串1中所有输入字符。
-s
删除所有重复出现字符序列,只保留第一个;即将重复出现字符串压缩为一个字符串。
input-file是转换文件名。虽然可以使用其他格式输入,但这种格式最常用。
指定字符串1或字符串2的内容时,只能使用单字符或字符串范围或列表。
[a-z]
a-z内的字符组成的字符串。
[A-Z] A-Z内的字符组成的字符串。
[0-9] 数字串。
\octal
一个三位的八进制数,对应有效的ASCII字符。
[O*n]
表示字符O重复出现指定次数n。因此[O*2]匹配OO的字符串。
tr中特定控制字符的不同表达方式
速记符含义八进制方式
\a
Ctrl-G 铃声\007
\b Ctrl-H 退格符\010
\f Ctrl-L 走行换页\014
\n
Ctrl-J 新行\012
\r Ctrl-M 回车\015
\t Ctrl-I tab键\011
\v
Ctrl-X \030
3. 举例说明
a. 合并字符串中重复出现的字符
tr -s
"[\n]" < input.txt
#文件input.txt中的所有重复出现的换行符最多只出现一次。
echo aaaabbbbccccddddddd | tr
-s "[a-z]" #输出abcd
b. 删除字符串中得字符
echo
helloworld | tr -d "o" #输出hellwrld
注意echo helloworld | tr
-d "hello"的输出结果是wrd,因此tr是将字符串1的各个字符串单独处理的
c. 字符串的替换
假设input.txt中内容是a:b:c:d:e,那么运行tr -s "[:]" "[\t]" < input.txt的结果将是a
b c
d,各个子串间以tab隔开。同样的出现在字符串1和字符串2中的字符都是单个处理的,并不是将之看成是一个整体。
在vi中也能使用tr命令,但在该命令前要加上要处理的行范围和!,例如1,$!tr -s "[\r]" "[\n]" ($表示最后一行)
阅读(1229) | 评论(0) | 转发(0) |