Chinaunix首页 | 论坛 | 博客
  • 博客访问: 561115
  • 博文数量: 375
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 15
  • 用 户 组: 普通用户
  • 注册时间: 2013-09-20 10:21
文章分类

全部博文(375)

文章存档

2015年(1)

2014年(374)

分类: LINUX

2014-08-18 14:01:08

原文地址:awk之模拟sort多字段排序 作者:zooyo

cat file:
PIC aaa 12:00 23
PIC aaa 13:00 34
VOD bbb 02:15 55
VOD vds 03:22 65
VOD vds 04:22 40
VOD abs 05:22 30
DLL rft 15:10 22
IDD kjh 17:06 86
PIC hgf 12:45 30
PIC bbb 11:45 35

要求: 在第一列正序排列的基础上对第四列倒序排列





  1. awk '{a[$1"|"$4]=$0;b[$1];c[$4]}END{
  2. for(i=1;i<=asorti(b,bb);i++)
  3. for(j=asorti(c,cc);j>=1;j--)
  4. if(bb[i]"|"cc[j] in a)
  5. print a[bb[i]"|"cc[j]]
  6. }' file
[解析]
通过三个数组来保存各自需要的信息. 首先对数组b进行正序排序, 然后对数组c进行倒序排序, 然后判断这两个下标是否存在于数组a中, 存在然后输出.



  1. awk '{a[$1][$4]=$0}END{for(i=1;i<=asorti(a,b);i++)for(j=asorti(a[b[i]],c);j>=1;j--)print a[b[i]][c[j]]}' file
[解析]
这是awk 4.0支持的写法. "array of array" in gawk 4.0
 

阅读(1107) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~