Sed(a stream editor)
4个空间:input stream, pattern buffer, output stream和hold buffer
基本操作过程是:
(1).将input stream的当前行放入pattern buffer,然后input stream的指针指向下一行;
(2).对pattern buffer中的行进行处理;
(3).将2的处理结果放入output stream.然后循环这个过程.
hold buffer是另一个空间,可以通过命令和pattern buffer进行交互.
sed命令介绍
1. 基本命令---"替换": s
1.1 基本用法
e.g. sed 's/day/night/'
new
该例子将文件old中的每一行第一次出现的day替换成night,将结果输出到文件new
s "替换"命令
/../../ 分割符(Delimiter)
day 搜索字符串
night 替换字符串
其实,分割符"/"可以用别的符号代替,比如",", "|"等.
e.g. sed 's/\/usr\/local\/bin/\/common\/bin/'new
等价于sed 's_/usr/local/bin_/common/bin_' new
显然,此时用"_"作分割符比"/"好得多.
1.2 用&表示匹配的字符串
有时可能会想在匹配到的字符串周围或附近加上一些字符.
e.g. sed 's/abc/(abc)/' new
该例子在找到的abc前后加上括号.
该例子还可以写成 sed 's/abc/(&)/' new
下面是更复杂的例子:
sed 's/[a-z]*/(&)/' new
sed 's/[0-9]*/& &/' new
1.3 用\1, \2, ..., \9来表示匹配的字符串
e.g. sed 's/\([a-z]*\)[0-9]*/\1/' new
本例中\1就是指前面的\([a-z]*\)
sed 's/\([a-z]*\) \([0-9]*\)/\2 \1/' new
本例中\2和\1分别代表前面的\([0-9]*\)和\([a-z]*\)
\1, \2, ..., \9也可以出现在搜索字符串中
e.g. sed 's/\([a-z]*\) \1/\1/' new
本例可以去除重复的由字母组成的词
1.4 "替换"选项
1.4.1 /g 替换所有的
sed默认只替换搜索字符串的第一次出现,利用/g可以替换搜索字符串所有
出现的地方.例如,
sed 's/\([^ ]*\)/(&)/g' new
1.4.2 用/1, /2, ...来表明替换哪一次出现
e.g. sed 's/[^ ]*//2' new
可以从/1用到/512
1.4.3 /p print选项
当sed命令有-n选项时,该命令没用输出.
-n配合/p选项后,如果该行确实发生了替换,则输出该行,否则不输出.
1.4.4 /w filename 写到文件filename中
e.g. sed 's/\([0-9]*\) \([a-z]*\)/\2/w new' 该例子把输出放入文件new中
1.5 替换和插入换行符号
替换 (echo a;echo x;echo y) | sed '/x$/ {
N
s:x\n:x:
}'
插入
(echo a;echo x;echo y) | sed 's:x:X\
:'
2. 只对特定行的处理
2.1 通过行号限定
sed '3 s/[0-9][0-9]*//' new 只处理第3行
sed '1,100 s/A/a/' new 只处理1到100行
sed '101,$ s/A/a/' new 处理101到文件的最后一行
sed '101,$ !s/A/a/' new 这里!表示只对1到100行进行替换,!的作用是取反
2.2 通过正规表达式限定
sed '/start/,/stop/ s/#.*//' new
本例中,sed先找到有start的行作为开始,找到最近的有stop的行作为结束,对之
间的行进行操作.
重复上述过程,直到文件结束
下面这个例子是行号和正规表达式配合来限定
sed '1,/start/ s/#.*//' new 对第1行到含有start的行进行处理
3. 其他的简单命令
3.1 删除命令 d
sed '11,$ d' new 删除从11行到文件末尾
sed '/^#/ d' new 删除所有以#开始的行
3.2 print命令 p (注意与s命令的/p选项的区别)
sed 'p' sed -n 'p' sed '/^$/ p' sed -n '1,10 p' sed -n '/match/ p'
3.3 quit命令 q
sed '11 q' 注意:q命令不能接收多行,例如
sed '2,5 q'
3.4 写入文件命令 w filename(注意与s命令的/w选项的区别)
把某些行写入文件filename
sed -n '/^[0-9]*[02468]/ w even'
3.5 输出行号命令 =
sed -n '/PATTERN/ ='
3.6 追加,改变,插入新行
追加命令 a
#!/bin/sh
sed '
/WORD/ a\
Add this line after every line with WORD
'
改变命令 c
#!/bin/sh
sed '
/WORD/ c\
Replace the current line with the line
'
插入命令 i
#!/bin/sh
sed '
/WORD/ i\
Add this line before every line with WORD
'
3.7 变换命令 y
sed 'y/abcdef/ABCDEF/'
3.8 将本行的控制符也显示出来的命令 l
sed '1,10 l'
3.9 d命令和D命令
d命令删除pattern buffer中的内容进入下一次操作循环
D命令删除pattern buffer中第一个换行符之前的内容进入下一次操作循环,如
果pattern buffer中还有内容,则不用从input stream中读入
3.10 p命令和P命令
p命令输出pattern buffer中的内容
P命令输出pattern buffer中第一个换行符之前的内容
3.11 n命令和N命令
n命令把下一行读入pattern buffer中(如果没用-n选项,将原来行输出)
N命令把下一行追加到pattern buffer中
3.12 流程控制命令
b label命令:在指定行跳到label
t label命令:如果在某行发生了替换,跳到label
T label命令:如果在某行没有发生了替换,跳到label
4. 调用sed时的参数
4.1 -e script 执行script这个脚本
e.g. sed -e 's/a/A/' -e 's/b/B/' new
对每一行分别执行's/a/A/'和 's/b/B/'
4.2 -n 禁止输出
这里的-n与前面的/p配合,可以只输出被修改了的行.
4.3 -f scriptname 把scriptname文件中的sed命令加入本次sed的调用中
e.g. sed -f sedscript new
sedscript的内容可能是这样的:
# sed comment - This script changes lower case vowels to upper case
s/a/A/g
s/e/E/g
s/i/I/g
s/o/O/g
s/u/U/g
5. Hold Buffer
x命令:将pattern buffer放入hold buffer,而将hold buffer的内容输出,pattern
buffer的内容变成下一行
h命令:将pattern buffer放入hold buffer,并将pattern buffer的内容输出,
pattern buffer的内容变成下一行
H命令:将pattern buffer追加到hold buffer
g和G命令:g用hold buffer的内容替换pattern buffer的内容,而G将hold buffer内
容追加到pattern buffer
参考:
阅读(735) | 评论(0) | 转发(0) |