awk实际应用：文本合并-eatmyshort-ChinaUnix博客

bart&nbsp;的资料

首页　| 　博文目录　| 　关于我

eatmyshort

博客访问： 136197
博文数量： 37
博客积分： 0
博客等级：民兵
技术积分： 0
用户组：普通用户
注册时间： 2016-07-02 01:04

个人简介

文章分类

全部博文（37）

SQL（0）
操作系统（1）
mysql（7）
shell（16）
linux（2）
python（6）
sybase（5）
未分配的博文（0）

文章存档

2016年（33）

2015年（4）

我的朋友

相关博文

awk实际应用：文本合并

分类： LINUX

2016-01-16 01:23:52

请使用awk命令将如下两份文件中名字相同的两行合并起来。
[root@localhost ~]# cat 1.txt
韩海林 21岁
海林韩 23岁
韩林海 22岁
林海韩 24岁
[root@localhost ~]# cat 2.txt
韩林海男
海林韩男
韩海林男
林海韩男

输出效果：
韩海林 21岁男
[root@localhost ~]# awk 'NR==FNR{a[$1]=$2}NR>FNR{print $0,a[$1]}' 2.txt 1.txt
韩海林 21岁男
海林韩 23岁男
韩林海 22岁男
林海韩 24岁男

[root@localhost~]# awk 'NR==FNR{a[$1]=$2}NR>FNR{print $0,a[$1]}' 2.txt 1.txt > 3.txt
[root@localhost ~]# cat 3.txt
韩海林 21岁男
海林韩 23岁男
韩林海 22岁男
林海韩 24岁男

解释：
在awk里，NR和FNR的含义相近，唯一的区别就是作用范围，NR是所有读取的行信息计数，而FNR是正在读取文件的行信息计数，FNR在文件切换时会从0重新开始计数，所以上述语句的意思是：
NR==FNR NR最大值为4，FNR值为1-4，以2.txt的第一个数据项为key，$2即第2列为数据组成数组；
NR>FNR 此时NR=（2.txt的总行数+FNR），NR最大值为8，FNR则重新从1-4计数，判断第一个数据项在不在2.txt数据组成的数组里，如果在，则打印本行加数组项。

NR是英文number of record的简写，就是awk每从文件或输入流中读入一行数据，就把这个变量加一。这个是awk自带的变量。

其他的解释：
NR==FNR{a[$1]=$2}
打开第一个文件2.txt，把文件里面的$2列的内容存入到a[$1]这个数组。
NR>FNR{print $0,a[$1]}
然后打开第二个文件，打印1.txt一行内容，然后打印第一个文件a[$1]数组的内容。

加入if判断，更容易理解，上面的命令省略了；判断1.txt的第一列内容在a数组里面，打印整行内容和a[$1]数组内容；
[root@localhost ~]# awk 'NR==FNR{a[$1]=$2;next}NR>FNR{if($1 in a)print $0,a[$1]}' 2.txt 1.txt
韩海林 21岁男
海林韩 23岁男
韩林海 22岁男
林海韩 24岁男

文件顺序不同，结果也不同；
[root@localhost ~]# awk 'NR==FNR{a[$1]=$2}NR>FNR{print $0,a[$1]}' 1.txt 2.txt
韩林海男 22岁
海林韩男 23岁
韩海林男 21岁
林海韩男 24岁
转自

阅读(1289) | 评论(0) | 转发(0) |

上一篇：shell 日常工作文本用到的一些脚本整理...

下一篇：mysql---为测试数据库填充大量数据

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6