awk中FS的一点细节-48576958-ChinaUnix博客

hqu_yangleizhou

首页　| 　博文目录　| 　关于我

48576958

博客访问： 456538
博文数量： 362
博客积分： 0
博客等级：民兵
技术积分： 10
用户组：普通用户
注册时间： 2015-07-26 17:08

文章分类

全部博文（362）

智能卡（0）
Makefile（1）
TCP/Ip源码分析（50）
shell（8）
建立根文件系统（4）
内核移植（9）
Bootloader（30）
调试技术（2）
代码管理（6）
校验（1）
QT（1）
指针（2）
器件文档（4）
linux（111）

input子系统（11）

epoll（8）

Linux I2C驱（25）

Bash（0）

操作系统（38）

linux_网络篇（1）

linux_内核篇（28）
ARM（133）

设备驱动（38）

寄存器（1）

mini2440（62）

u_boot（20）

存储器（1）

裸机开发_mini244（11）
未分配的博文（0）

文章存档

2015年（362）

我的朋友

相关博文

awk中FS的一点细节

分类： LINUX

2015-12-11 00:42:57

原文地址：awk中FS的一点细节作者：Bean_lee

在学习Effective awk Program。在工作中虽然shell也算是自己的常规武器，但是shell的运用并不纯熟，把书中自己理解不深，或者没注意到的地方记录一下，毕竟每次看英文书有点重点不突出。
Effective awk Program 第三章Reading Input Files中的Using Regular Expression to Separate Fields中提到了一个很有趣的现象。

echo " a b c d " | awk '{ print $2 }'
echo " a b c d " | awk 'BEGIN {FS="[ \t\n]"} {print $2}'

这两个的输出是否一致，我学习这一章节之前，认为输出是相同的，都是b。实际上：

我们看到第一个命令和第二个命令的输出是不一样的。原因在于，默认的情况下，FS是空格，这种情况下，处理之前，首先会将strip掉头部的空格和tab，以及尾部的空格和tab，但是如果FS修改成[ \t\n]这种形式，就不会strip掉头部和尾部的空白字符，那么，如果头部有1个空格，我们看到$1是null或者empty。

另一个比较有意思的现象是，如果record重新组建，会导致头部和尾部的空白字符strip掉。

我们看到，仅仅是执行了$2=$2这个看起来毫无意义的操作，头部的空格就被strip掉了，事实上尾部的2个空格也被strip掉了。因为赋值操作引发了字符串的rebuild，而rebuild的过程要查找$1,$2...$NF,链接起来，查找$1的过程等同与FS=“ ”的时候的$1,空白字符（空格和tab）会被忽略掉，所以，concatenated string 也就没有头部和尾部的空白字符了。

参考文献：
1 effective awk program

阅读(762) | 评论(0) | 转发(0) |

上一篇：awk之getline

下一篇：统计文本中某单词的出现的次数

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6