awk 基本介绍及示例-zhengsenlin888-ChinaUnix博客

111zhengsenlin.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

zhengsenlin888

博客访问： 1742293
博文数量： 362
博客积分： 10587
博客等级：上将
技术积分： 4098
用户组：普通用户
注册时间： 2009-09-10 18:15

文章分类

全部博文（362）

php（2）
Erlang（3）
apache（13）
perl（18）
The C Language（0）
freebsd（0）
Iptables（2）
Python（26）
Shell（24）
Linux System Adm（48）
Windows（0）
How To Study（0）
Database（27）
Middleware（0）
Security（0）
BBS（4）
未分配的博文（195）

文章存档

2014年（1）

2013年（58）

2011年（115）

2010年（112）

2009年（76）

我的朋友

最近访客

推荐博文

awk 基本介绍及示例

分类：

2010-09-19 17:03:42

相较于 sed 常常作用于一整个行的处理， awk 则比较倾向于一行当中分成数个『字段』来处理。因此，awk 相当的适合处理小型的数据数据处理呢！awk 通常运作的模式是这样的：

[root@linux ~]# awk '条件类型1{动作1} 条件类型2{动作2} ...' filename

awk 可以处理后续接的档案，也可以读取来自前个指令的 standard output 。但如前面说的， awk 主要是处理『每一行的字段内的数据』，而预设的『字段的分隔符为 "空格键" 或 "[tab]键" 』！

我想要取出账号与登入者的 IP ，且账号与 IP 之间以 [tab] 隔开

#last | awk '{print $1 "\t" $3}'

另外，由上面这个例子您也会知道，在每一行的每个字段都是有变量名称的，那就是 $1, $2... 等变量名称，以上面的例子来说， dmtsai 是 $1 ，因为他是第一栏嘛！至于 192.168.1.12 是第三栏，所以他就是 $3 啦！后面以此类推～呵呵！还有个变数喔！那就是 $0 ，$0 代表『一整列资料』的意思～以上面的例子来说，第一行的 $0 代表的就是『dmtsai pts/0.... 』那一行啊！由此可知，刚刚上面四行当中，整个 awk 的处理流程是：

读入第一行，并将第一行的资料填入 $0, $1, $2.... 等变数当中；

依据 "条件类型" 的限制，判断是否需要进行后面的 "动作"；

做完所有的动作与条件类型；

若还有后续的『行』的数据，则重复上面 1~3 的步骤，直到所有的数据都读完为止。

经过这样的步骤，您会晓得， awk 是『以行为一次处理的单位』，而『以字段为最小的处理单位』。

NR 表示第几行

NF 表示第几列

FS 表示分隔符

linux-c93g:~ # last | awk '{print $1 "\t line:" NR "\t cloumes:" NF}'

root line:1 cloun:10 （表示第一行有10列）

root line:2 cloun:10 （表示第二行有10列）

reboot line:3 cloun:9（表示第三行有9列）

reboot line:4 cloun:9（表示第四行有9列）

root line:5 cloun:10

reboot line:6 cloun:9

reboot line:7 cloun:9

awk 的逻辑运算字符

既然有需要用到 "条件" 的类别，自然就需要一些逻辑运算啰～例如底下这些：

运算单元	代表意义
>	大于
<	小于
>=	大于或等于
<=	小于或等于
==	等于
!=	不等于

[root@linux ~]# cat /etc/passwd | \
> awk '{FS=":"} $3 < 10 {print $1 "\t " $3}'
root:x:0:0:root:/root:/bin/bash
bin      1
daemon   2
......(以下省略)......

有趣吧！不过，怎么第一行没有正确的显示出来呢？这是因为我们读入第一行的时候，那些变数 $1, $2... 预设还是以空格键为分隔的，所以虽然我们定义了 FS=":" 了，但是却仅能在第二行后才开始生效。那么怎么办呢？我们可以预先设定 awk 的变量啊！利用 BEGIN 这个关键词。如下所示：

#cat /etc/passwd | awk 'BEGIN {FS=":"} $3 < 10 {print $1 "\t" $3}'

阅读(1488) | 评论(0) | 转发(0) |

上一篇：sed基本介绍及示例

下一篇：diff cmp patch

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6