Chinaunix首页 | 论坛 | 博客
  • 博客访问: 822520
  • 博文数量: 92
  • 博客积分: 1498
  • 博客等级: 上尉
  • 技术积分: 993
  • 用 户 组: 普通用户
  • 注册时间: 2009-09-18 18:31
文章分类

全部博文(92)

文章存档

2013年(2)

2012年(3)

2011年(3)

2010年(61)

2009年(23)

分类: LINUX

2011-04-28 16:23:17

欢迎访问我的个人主页

 

这里介绍的是sed的一个多行模式的使用,一开始对sed中命令N的用法不是很理解,经过多次尝试,通过几个例子对N的用法进行总结:

N即Next,它同n(next)的区别是:N命令将下一行追加到模式空间中,不打印模式空间的值,而使用n是打印当前模式空间的内容,并且读取下一行

蒙受启发

> cat num

1

2

3

4

5

6

7

8

9

> sed ’N;$!D’ num

8

9

>

是如何执行的?

首先解释重要的几个命令的用途:

D删除模板块的第一行 并返回脚本头部执行

$ 锚定行的结束 如:/sed$/匹配所有以sed结尾的行 ,继续执行

! 表示后面的命令对所有没有被选定的行发生作用。
大概说一下:
N;$!D
首先读入第一行: 1 (注:这不是N命令读入的)
执行N,读入第2行,追加到1后面,成了1\n2;
$!D,不是最后一行,所以执行D,模式空间由1\n2成了2, 控制流返回脚本第一条命令,即N。这样一直执行
….
直到执行N读入第9行:9,这里模式空间为:8\n9
$!D,因为是最后一行,所以不执行D,控制流到达脚本底部,输出模式空间的内容:
8
9

上面这段例子摘自网络,给了我很大启发,另外测试如下:

关于N:

append the next line of input into the pattern space. 这是sed用户手册当中说的,很明显,意思是将当前读入行的下一行读取到当前的模式空间。

关于P:

Print up to the first embedded newline of the current pattern space.打印当前模式空间中的第一块。

关于D:

Delete up to the first embedded newline in the pattern space.  Start next cycle, but skip reading from  the  input if there is still data in the pattern space.

删除当前模式空间的第一块,重新开始下一次循环,这个在后面例子中给予验证:

各种验证

验证一:NP结合

> cat num

1

2

3

4

> sed ’N;P’ num

1

1

2

3

3

4

> sed ’N;p’ num

1

2

1

2

3

4

3

4

对于上面的结果给予解释:P用于打印当前模式空间的第一块,而p打印整个当前模式空间。所以当使用P的时候,步骤如下:首先sed默认的读取1,模式空间为1,让你后执行N,模式空间变成1\n2\n,然后执行P,也就是打印1\n;当前行的处理,打印模式空间也就是1\n2\n;这时sed再从文件中读取下一行,也就到了3\n,执行N;模式空间变成了3\n4\n;

执行P;打印3\n;继续执行当前行的处理,打印模式空间3\n4\n;sed再从文件中读取下一行,发现没有了,结束处理流程。对于小p,和d大P的区别了解的话也就不难理解了。

验证二:ND结合

> cat num

1

2

3

4

> sed ’N;D’ num

4

> sed ’N;d’ num

>

对于D;删除当前模式空间第一块,并且返回命令开始继续执行。上述结果解释如下:

首先sed读取一行1\n;执行到N;模式空间为1\n2\n;执行D;模式空间变为:2\n;跳到前面继续执行N;模式空间变为2\n3\n;执行D;模式空间变为:3\n;跳回继续执行N;模式空间变为:3\n4\n;接着执行D;模式空间变为:4\n;跳回执行N的时候发现没有了下一行,所以跳出循环,接着sed继续处理,打印4\n;sed继续再读取文件的时候没有数据,所以结束处理。

验证3:NpD,再验证

> cat num

1

2

3

4

> sed ’N;p;D’ num

1

2

2

3

3

4

4

首先,sed读取一行,执行到N;模式空间为:1\n2\n;执行p;打印1\n2\n;执行D;模式空间变为:2\n;跳回执行N;模式空间变为:2\n3\n;执行p;打印2\n3\n;执行D;模式空间变为:3\n;跳回执行N;模式空间变为:3\n4\n;执行p;打印3\n4\n;执行D;模式空间变为:4\n;跳回执行N;没有数据。跳出循环,sed继续处理,默认打印模式空间所有数据4\n; 因此只有1打印一遍,其余行都打印2遍。

另外d和大D的区别了解以后也就明白了。

总结体会:sed处理始终在一个模式空间中进行,而且对于待处理文件,N读取了文件中的一行后,sed继续处理的时候应该是接着去读取,这里我理解是sed读取文件和N读取文件这些的共用一个指针。

在sed处理文件的时候,每一行都被保存在一个叫模式空间的临时缓冲区中,除非行被删除或者输出被取消,否则所有被处理的行都将 打印在屏幕上。接着模式空间被清空,并存入新的一行等待处理。

常用命令:

利用sed给每行添加行号。

> cat passwd

uucp:x:10:14:Unix-to-Unix CoPy system:/etc/uucp:/bin/bash

mqq:x:1000:100::/usr/local/app:/bin/bash

mysql:x:1001:1001::/home/mysql:/bin/bash

natpan:x:1002:100::/data/natpan:/bin/bash

nagios:x:1003:100::/home/nagios:/bin/bash

nagios:x:1003:100::/home/nagios:/bin/bash

nagios:x:1003:100::/home/nagios:/bin/bash

给每行加上行号,命令如下:

> sed = passwd | sed ’N;s/\n/:   /g’

1:   uucp:x:10:14:Unix-to-Unix CoPy system:/etc/uucp:/bin/bash

2:

3:   mqq:x:1000:100::/usr/local/app:/bin/bash

4:   mysql:x:1001:1001::/home/mysql:/bin/bash

5:   natpan:x:1002:100::/data/natpan:/bin/bash

6:   nagios:x:1003:100::/home/nagios:/bin/bash

7:   nagios:x:1003:100::/home/nagios:/bin/bash

8:   nagios:x:1003:100::/home/nagios:/bin/bash

mqq@wsd_207_62_sles10sp1:~/alenzhou/shell_test/sed>

空行不打印行号,做一下匹配就行

> sed ’/./=’ passwd | sed ’/./N;s/\n/:   /g’

1:   uucp:x:10:14:Unix-to-Unix CoPy system:/etc/uucp:/bin/bash

3:   mqq:x:1000:100::/usr/local/app:/bin/bash

4:   mysql:x:1001:1001::/home/mysql:/bin/bash

5:   natpan:x:1002:100::/data/natpan:/bin/bash

6:   nagios:x:1003:100::/home/nagios:/bin/bash

7:   nagios:x:1003:100::/home/nagios:/bin/bash

8:   nagios:x:1003:100::/home/nagios:/bin/bash

下面这个连接是不错的。大家如果能读懂连接中给出的每一个命令,那就很不错了。上面我说的如果有什么不对的地方欢迎随时拍砖。

阅读(5760) | 评论(1) | 转发(0) |
给主人留下些什么吧!~~

rendajuan07112014-03-11 09:35:14

你好,看完您的帖子很有收获,但还是有个问题:即何时进行当前行的处理,例如 sed ’N;D’ num
首先sed读取一行1\n;执行到N;模式空间为1\n2\n;执行D;模式空间变为:2\n;跳到前面继续执行N。。。接着sed继续处理,(打印4\n;sed继续再读取文件的时候没有数据,所以结束处理)此处。
从这个例子看跳出循环之后,sed打印最后一个循环模式空间的数,而这个例子sed ’N;p;D’ num
首先,sed读取一行,执行到N;模式空间为:1\n2\n;执行p;打印1\n2\n;执行D;模式空间变为:2\n;跳回执行N;。。。跳出循环,(sed继续处理,默认打印模式空间所有数据4\n; 因此只有1打印一遍,其余行都打印2遍)此处。
由这个例子看,循环完后,sed继续处理,打印的是每次循环完后模式空间剩余的数。
觉得这两个例子的结果矛盾,不知道循环完后,sed继续处理,打印的到底是每次循环完模式空间的数呢还是最后一个循环的模式空间的数呢