awk之腾讯面试题-kk5234-ChinaUnix博客

kk5234的ChinaUnix博客netlyz.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

kk5234

博客访问： 216332
博文数量： 87
博客积分： 192
博客等级：入伍新兵
技术积分： 455
用户组：普通用户
注册时间： 2011-04-14 07:44

文章分类

全部博文（87）

自动化运维（2）
故障解决（2）
命令（1）
性能调优（1）
负载均衡（3）
web（5）
mysql（2）
awk（16）
sed（25）
shell（12）
未分配的博文（18）

文章存档

2013年（1）

2012年（86）

我的朋友

最近访客

推荐博文

awk之腾讯面试题

分类：

2012-04-14 15:32:28

原文地址：awk之腾讯面试题作者：zooyo

3 5 6 7
2 3 1 0
4 5 6 9
2 3 4 4
2 2 1 0
4 5 0 9
假如把2列和3列的值作为新的第5列，第5列的平均值为avg5,求第5列中大于avg5的行数。

awk '{x+=$2+$3;a[NR]=$2+$3}END{y=x/NR;for(i in a){if(y<a[i])z++}print z}' file

[解析]

这个题初看，觉得简单，仔细看又觉得有难度，否则腾讯这些大企业也不会出这么简单的题了，呵呵。首先来分析，第5列的值很好办 $2+$3，但是求平均值比较麻烦，麻烦的原因是只有最后END才可以通过累加的x的值来除以行数然后得出平均值，又有个一个新的问题，这时候已经END了，求出了平均值但是无法再从新历遍全文去比较每行的 $2+$3 是否大于该平均值，怎么着？总得有个东西来装 $2+$3 的结果吧，目的是将$2+$3的结果放入一个容器，在END求出平均值后再拿出来判断比较，惯例请出我们的老朋友数组。最后的大家都能看懂了吧。

awk 'BEGIN{while(getline<"file"){x+=$2+$3;i++};y=x/i}{if($2+$3>y)z++}END{print z}' file

[解析]

这是7月22日更新的新命令，我新学会的一种处理手段，在BEGIN模块中利用 while(getline<"file") 来提前历遍全文，在BEGIN中我们可以看到，我已经把$2+$3的和累加给了x变量，但是求平均值必须要知道行数，怎么办呢？这时候在BEGIN中NR还是0，当然可以搞定了，我们这时候就不用NR自己建个变量来保存行数就好了嘛，这样我们可以顺利的在BEGIN模块中就已经求出了平均数了。然后按照正常的执行流程再逐行判断第2列和第3列的和是否大于这个平均数，最后打印统计结果。

阅读(1414) | 评论(0) | 转发(0) |

上一篇：awk之获取匹配两个关键字之间的行(不包括关键字行)

下一篇：awk之利用管道调用shell命令

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6