Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1858304
  • 博文数量: 343
  • 博客积分: 10342
  • 博客等级: 上将
  • 技术积分: 2892
  • 用 户 组: 普通用户
  • 注册时间: 2008-08-15 12:34
个人简介

你必须非常努力,才能看起来毫不费力!

文章存档

2012年(3)

2011年(5)

2010年(2)

2009年(40)

2008年(293)

分类:

2008-10-13 12:51:00

Sed(a stream editor)
4个空间:input stream, pattern buffer, output stream和hold buffer
基本操作过程是:
(1).将input stream的当前行放入pattern buffer,然后input stream的指针指向下一行;
(2).对pattern buffer中的行进行处理;
(3).将2的处理结果放入output stream.然后循环这个过程.

hold buffer是另一个空间,可以通过命令和pattern buffer进行交互.

sed命令介绍

1. 基本命令---"替换": s
  1.1 基本用法
  e.g. sed 's/day/night/' new
  该例子将文件old中的每一行第一次出现的day替换成night,将结果输出到文件new
  s            "替换"命令
  /../../      分割符(Delimiter)
  day          搜索字符串
  night        替换字符串

  其实,分割符"/"可以用别的符号代替,比如",", "|"等.
  e.g. sed 's/\/usr\/local\/bin/\/common\/bin/'new
  等价于sed 's_/usr/local/bin_/common/bin_' new
  显然,此时用"_"作分割符比"/"好得多.


  1.2 用&表示匹配的字符串

  有时可能会想在匹配到的字符串周围或附近加上一些字符.
  e.g. sed 's/abc/(abc)/' new
  该例子在找到的abc前后加上括号.
  该例子还可以写成 sed 's/abc/(&)/' new
  下面是更复杂的例子:
  sed 's/[a-z]*/(&)/' new
  sed 's/[0-9]*/& &/' new

  1.3 用\1, \2, ..., \9来表示匹配的字符串

  e.g. sed 's/\([a-z]*\)[0-9]*/\1/' new
  本例中\1就是指前面的\([a-z]*\)

  sed 's/\([a-z]*\) \([0-9]*\)/\2 \1/' new
  本例中\2和\1分别代表前面的\([0-9]*\)和\([a-z]*\)

  \1, \2, ..., \9也可以出现在搜索字符串中
  e.g. sed 's/\([a-z]*\) \1/\1/' new
  本例可以去除重复的由字母组成的词

  1.4 "替换"选项
      1.4.1 /g 替换所有的
      sed默认只替换搜索字符串的第一次出现,利用/g可以替换搜索字符串所有
      出现的地方.例如,
      sed 's/\([^ ]*\)/(&)/g' new

      1.4.2 用/1, /2, ...来表明替换哪一次出现
      e.g. sed 's/[^ ]*//2' new
      可以从/1用到/512

      1.4.3 /p print选项
      当sed命令有-n选项时,该命令没用输出.
      -n配合/p选项后,如果该行确实发生了替换,则输出该行,否则不输出.

      1.4.4 /w filename 写到文件filename中
      e.g. sed 's/\([0-9]*\) \([a-z]*\)/\2/w new'       该例子把输出放入文件new中

  1.5 替换和插入换行符号
  替换 (echo a;echo x;echo y) | sed '/x$/ {
       N
       s:x\n:x:
       }'

  插入
       (echo a;echo x;echo y) | sed 's:x:X\
       :'



2. 只对特定行的处理

  2.1 通过行号限定
  sed '3 s/[0-9][0-9]*//' new 只处理第3行

  sed '1,100 s/A/a/' new 只处理1到100行

  sed '101,$ s/A/a/' new 处理101到文件的最后一行

  sed '101,$ !s/A/a/' new 这里!表示只对1到100行进行替换,!的作用是取反


  2.2 通过正规表达式限定
  sed '/start/,/stop/ s/#.*//' new
  本例中,sed先找到有start的行作为开始,找到最近的有stop的行作为结束,对之
  间的行进行操作.
  重复上述过程,直到文件结束

  下面这个例子是行号和正规表达式配合来限定
  sed '1,/start/ s/#.*//' new 对第1行到含有start的行进行处理


3. 其他的简单命令
  3.1 删除命令 d
  sed '11,$ d' new 删除从11行到文件末尾
  sed '/^#/ d' new 删除所有以#开始的行

  3.2 print命令 p (注意与s命令的/p选项的区别)
  sed 'p'   sed -n 'p'   sed '/^$/ p'   sed -n '1,10 p'   sed -n '/match/ p'
  3.3 quit命令 q
  sed '11 q'  注意:q命令不能接收多行,例如
  sed '2,5 q'
  3.4 写入文件命令 w filename(注意与s命令的/w选项的区别)
  把某些行写入文件filename
  sed -n '/^[0-9]*[02468]/ w even'
  3.5 输出行号命令 =
  sed -n '/PATTERN/ ='
  3.6 追加,改变,插入新行
  追加命令 a
  #!/bin/sh
  sed '
  /WORD/ a\
  Add this line after every line with WORD
  '

  改变命令 c
  #!/bin/sh
  sed '
  /WORD/ c\
  Replace the current line with the line
  '

  插入命令 i
  #!/bin/sh
  sed '
  /WORD/ i\
  Add this line before every line with WORD
  '

  3.7 变换命令 y
  sed 'y/abcdef/ABCDEF/'
  3.8 将本行的控制符也显示出来的命令 l
  sed '1,10 l'
  3.9 d命令和D命令
  d命令删除pattern buffer中的内容进入下一次操作循环
  D命令删除pattern buffer中第一个换行符之前的内容进入下一次操作循环,如
  果pattern buffer中还有内容,则不用从input stream中读入

  3.10 p命令和P命令
  p命令输出pattern buffer中的内容
  P命令输出pattern buffer中第一个换行符之前的内容

  3.11 n命令和N命令
  n命令把下一行读入pattern buffer中(如果没用-n选项,将原来行输出)
  N命令把下一行追加到pattern buffer中

 3.12 流程控制命令
  b label命令:在指定行跳到label
  t label命令:如果在某行发生了替换,跳到label
  T label命令:如果在某行没有发生了替换,跳到label

4. 调用sed时的参数

  4.1 -e script 执行script这个脚本
  e.g. sed -e 's/a/A/' -e 's/b/B/' new
  对每一行分别执行's/a/A/'和 's/b/B/'

  4.2 -n     禁止输出
  这里的-n与前面的/p配合,可以只输出被修改了的行.

  4.3 -f scriptname 把scriptname文件中的sed命令加入本次sed的调用中
  e.g. sed -f sedscript new

  sedscript的内容可能是这样的:
  # sed comment - This script changes lower case vowels to upper case
  s/a/A/g
  s/e/E/g
  s/i/I/g
  s/o/O/g
  s/u/U/g

5. Hold Buffer

  x命令:将pattern buffer放入hold buffer,而将hold buffer的内容输出,pattern
  buffer的内容变成下一行
  h命令:将pattern buffer放入hold buffer,并将pattern buffer的内容输出,
  pattern buffer的内容变成下一行
  H命令:将pattern buffer追加到hold buffer
  g和G命令:g用hold buffer的内容替换pattern buffer的内容,而G将hold buffer内
  容追加到pattern buffer

参考:
阅读(735) | 评论(0) | 转发(0) |
0

上一篇:什么叫做重定位?

下一篇:C++多态分析

给主人留下些什么吧!~~