awk之NR & FNR-network_sina-ChinaUnix博客

network_sina的ChinaUnix博客linuxsed.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

network_sina

博客访问： 22252
博文数量： 4
博客积分： 36
博客等级：民兵
技术积分： 30
用户组：普通用户
注册时间： 2010-03-31 09:52

文章分类

全部博文（4）

未分配的博文（4）

文章存档

2012年（4）

我的朋友

最近访客

推荐博文

awk之NR & FNR

分类：

2012-12-12 11:10:38

原文地址：awk之NR & FNR 作者：zooyo

NR,表示awk开始执行程序后所读取的数据行数.
FNR,与NR功用类似,不同的是awk每打开一个新文件,FNR便从0重新累计.

在看一个例子关于NR和FNR的典型应用:

#cat a
张三|000001
李四|000002

#cat b
000001|10
000001|20
000002|30
000002|15

想要得到的结果是将用户名，帐号和金额在同一行打印出来,如下:

张三|000001|10
张三|000001|20
李四|000002|30
李四|000002|15

awk -F'|' 'NR==FNR{a[$2]=$0;next}{print a[$1] FS $2}' a b
awk -F'|' '{a[$2]=$0}NR>FNR{print a[$1] FS $2}' a b

[解析]
由NR=FNR成立,判断当前读入的是第一个文件a,然后使用{a[$2]=$0;next}循环将a文件的每行记录都存入数组a,并使用$2作为下标引用.next,不在执行后面的语句.
由NR=FNR不成立,判断当前读入了第二个文件b,然后跳过{a[$2]=$0;next},对第二个文件b的每一行都无条件执行{print a[$1]FS$2},此时变量$1为第二个文件的第一个字段,与读入第一个文件时,采用第一个文件的$2为数组下标相同.因此可以在此输出该数组的值。下面那种写法是不是更短呢？

第二个例子：

文件passwd:
s2002408030068:x:527:527::/home/dz02/s2002408030068:/bin/pw
s2002408032819:x:528:528::/home/dz02/s2002408032819:/bin/pw
s2002408032823:x:529:529::/home/dz02/s2002408032823:/bin/pw

文件shadow:
s2002408030068:$1$d8NwFclG$v4ZTacfR2nsbC8BnVd3dn1:12676:0:99999:7:::
s2002408032819:$1$UAvNbHza$481Arvk1FmixCP6ZBDWHh0:12676:0:99999:7:::
s2002408032823:$1$U2eJ3oO1$bG.eKO8Zupe0TnyFhWX9Y.:12676:0:99999:7:::

用shadow文件中的密文部分替换passwd中的"x",生一个新passwd文件,如下所示
s2002408030068:$1$d8NwFclG$v4ZTacfR2nsbC8BnVd3dn1:527:527::/home/dz02/s2002408030068:/bin/pw
s2002408032819:$1$UAvNbHza$481Arvk1FmixCP6ZBDWHh0:528:528::/home/dz02/s2002408032819:/bin/pw
s2002408032823:$1$U2eJ3oO1$bG.eKO8Zupe0TnyFhWX9Y.:529:529::/home/dz02/s2002408032823:/bin/pw

awk 'BEGIN{FS=OFS=":"}NR==FNR{a[$1]=$2;next}{$2=a[$1]}1' shadow passwd

[解析]
NR==FNR，第一个文件shadow，以$1为下标，将$2的值赋给数组a，next不再执行后面的语句。
NR>FNR，第二个文件passwd，把$1为下标的数组a的值赋给密码x，就是$2。

第三个例子：

cat file1:
0011AAA 200.00 20050321
0012BBB 300.00 20050621
0013DDD 400.00 20050622
0014FFF 500.00 20050401

cat file2:
I0011 11111
I0012 22222
I0014 55555
I0013 66666

规则：比较 file1的1-4字符和 file2的2-5 字符，如果相同，将file2 的第二列与 file1 合并 file3
0011AAA 200.00 20050321 11111
0012BBB 300.00 20050621 22222
0013DDD 400.00 20050622 66666
0014FFF 500.00 20050401 55555

awk 'NR==FNR{a[substr($1,2)]=$2;next}{$0=$0 FS a[substr($1,1,4)]}1' file2 file1

[解析]
当NR=FNR时(就是file2文件),以substr(截取)file2文件第一个域的第2个字符开始，以长度为4的字符段为下标,把$2的值存入数组a中,next不再执行后面的语句。
读到第2个文件时候，pattern不再匹配，则执行后面的语句：打印第2个文本的全行，后面增加以$1为下标的数组a的值。

第四个例子：

file1文件
1 0.5 100
10 15 36.5

file2文件
50 10 9
3.2 1 5

将两个文件对应的字段进行相加以后的数字合成一个文件如：
51 10.5 109
13.2 16 41.5

awk 'NR==FNR{for(i=1;i<=NF;i++)a[FNR,i]=$i;next}{for(i=1;i<=NF;i++)$i=$i+a[FNR,i]}1' file1 file2

[解析]
把file1中的每个字段用二维下标存放进数组a，当pattern不成立时，执行后面的语句，把file2的每个字段和二维数组的值相加。

awk '{for(i=1;i<=NF;i++)a[FNR,i]+=$i}END{for(i=1;i<=FNR;i++){for(j=1;j<NF;j++)printf ("%-5s ",a[i,j]);print a[i,j]}}' file1 file2

[解析]
这是在读文件的同时就把2个文件中的二维数组的值相累加，最后再通过2次for循环格式化输出结果。此方式更好的能用于N个文件的每个数字的累加。

阅读(1212) | 评论(0) | 转发(0) |

上一篇：sed之批量更名

下一篇：结合情景学习linux命令之yes

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6