awk,sed,sort,uniq,head，常用统计-sxxs001-ChinaUnix博客

kenkenhuang.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

sxxs001

博客访问： 392231
博文数量： 166
博客积分： 1972
博客等级：上尉
技术积分： 1845
用户组：普通用户
注册时间： 2010-07-19 21:16

文章分类

全部博文（166）

It（2）
Ubuntu（2）

linux mint（0）
Mysql（1）
协议（2）
dos（1）
selinux（2）
rsync（2）
iptables（1）
apache（1）
mount（1）
squid（1）
coreseek（1）
监控（1）
cisco（1）
shell（30）
mysql（18）
nginx（16）

898（0）

php（5）
LAMP（6）

samba（1）
架构（6）
UBUNTU（8）
L2TP（0）
IT职业（1）
Linux Kernel（1）
Linux 应用（35）
JAVA（1）
网购（0）
健康（1）
Ros（0）
Windows（1）
HD Boot（1）
未分配的博文（22）

文章存档

2013年（7）

2010年（159）

我的朋友

最近访客

推荐博文

awk,sed,sort,uniq,head，常用统计

分类：

2010-10-19 18:22:26

From:

1 最简单的sitemap
(使用前确认目录下有html文件)

ls *.html ls *.html | awk '{ print "" $1 " " } '

2 汇总

样本文件,这里暂时称为 file1
====================
a
a
b
b
a
b
c
a
d
b
b
b
d
a
c
b
====================

3 还是汇总

样本文件存为 file2
====================
2001 a 1
2001 a 1
2002 b 2
2002 b 3
2003 a 4
2001 b 3
2001 c 3
2003 a 3
2004 d 3
2004 b 3
2004 b 3
2005 b 3
2005 d 3
2005 a 1
2006 c 2
2001 b 2
====================

本例假定第一列为时间,第二列为产品名,第三列为数量

先对时间进行汇总并排序

cat file2 cat file2 | cut -d" " -f1,3 cat file2 | cut -d" " -f1,3 | awk '{ a[$1]+=$2 } END { for (i in a) print i, a[i]; }' cat file2 | cut -d" " -f1,3 | awk '{ a[$1]+=$2 } END { for (i in a) print i, a[i]; }' | sort -rn -k2

它们的执行结果是什么样的?
cat file2 | cut -d" " -f1,3 | awk '{ a[$1]+=$2 } END { for (i in a) print i, a[i]; }' | sort -rn cat file2 | cut -d" " -f1,3 | awk '{ a[$1]+=$2 } END { for (i in a) print a[i], i; }' | sort -rn

填空,并实现上一组末尾命令的功能
cat file2 | awk '{ a[ ]+= } END { for (i in a) print a[i], i ; }' | sort -rn

那么,对产品汇总并排序呢?
cat file2 | awk '{ a[ ]+= } END { for (i in a) print a[i], i ; }' | sort -rn

偶只想要2001年的
cat file2 | grep "2001"

偶偏不要2001年的
cat file2 | grep -v "2001"

偶想看a
cat file2 | grep "a"

偶偏不要a
cat file2 | grep -v "a"

标上个序号
cat file2 | cut -d" " -f1,3 | awk '{ a[$1]+=$2 } END { for (i in a) print i, a[i]; }' | sort -rn -k2 | nl

倒过来,两种办法
cat file2 | cut -d" " -f1,3 | awk '{ a[$1]+=$2 } END { for (i in a) print i, a[i]; }' | sort -rn -k2 | tac cat file2 | cut -d" " -f1,3 | awk '{ a[$1]+=$2 } END { for (i in a) print i, a[i]; }' | sort -n -k2

4 单词统计(居然又是汇总…)

样例,存为 file3
====================
hello world who am i
i say hello world
who is fcicq
i do not know who is fcicq
why not to find out
====================

用awk过滤查看netstat 连接数

netstat -nat | awk ‘{print $6}’ | sort | uniq -c | sort -rn

阅读(817) | 评论(0) | 转发(0) |

上一篇：shell编程——if语句

下一篇：awk 使用小结

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6