Chinaunix首页 | 论坛 | 博客
  • 博客访问: 5473280
  • 博文数量: 890
  • 博客积分: 12876
  • 博客等级: 上将
  • 技术积分: 10760
  • 用 户 组: 普通用户
  • 注册时间: 2004-10-04 14:18
个人简介

猝然临之而不惊,无故加之而不怒。

文章分类

全部博文(890)

文章存档

2016年(1)

2014年(18)

2013年(41)

2012年(48)

2011年(65)

2010年(84)

2009年(121)

2008年(101)

2007年(129)

2006年(95)

2005年(118)

2004年(69)

分类:

2007-01-25 12:06:40



awk用于处理结构化的数据比如数据报表,一种文本处理功能强大的编程语言。


Linux下的/etc/passwd文件拿来当试手的例子非常合适。

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

这是我取我机器上这个文件的前5行,用来做测试


$ awk -F ":" '{ print }' passwd

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin


$ awk -F ":" '{ print $0 }' passwd 得到的结果和上面一摸一样


$ awk -F ":" '{print $1,$2}' passwd

root x

bin x

daemon x

adm x

lp x

-F ":"表示以:为分割符号,默认以空格分割。$0表示当前的整个行,而$1,$2...则相应代表分割后的列


逗号则让列与列之间插入空格

$ awk -F ":" '{print $1 $2}' passwd

rootx

binx

daemonx

admx

lpx

也可以使用插入字符来到达格式化的效果,$ awk -F ":" '{print $1 ” “ $2}' passwd和$ awk -F ":" '{print $1,$2}' passwd得到的结果是一样的


$ awk -F ":" '/root/{print "uid:" $3}' passwd

uid:0

这里使用了正则匹配,含有root的行输出第三列,这里就是uid


$ awk -F ":" '/^(root|bin)/{print $1}' passwd

root

bin

匹配以root或bin开头的行


$ awk -F ":" '$3==0 {print $0}' passwd

root:x:0:0:root:/root:/bin/bash

可以使用表达式,当uid等于0时输出这一行


还可以做数值运算

$ awk -F ":" '$3==0 {print $3+10}' passwd

10


$ awk -F ":" '{print ($3 > 1 ? "yes":"no")}' passwd

no

no

yes

yes

yes


$ awk -F ":" '/^root/,/^daemon/{print $0}' passwd

root:x:0:0:root:/root:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

匹配以root开头的行到以daemon开头的行,如果没有以daemon开头的行则将打印到文件末尾


$ awk -F ":" '$1~/bin/{i=$3+$4; print "i=" i}' passwd

i=2

既然awk是一种编程语言,我们就能够使用变量,上面就是匹配第一列以bin开头的行,取出第三和第四列相加赋值给i然后打印

我们还可以将在命令行中赋值的变量带到awk脚本中

$ awk -F ":" -f script i=1 j=2 passwd

这样在脚本script中可以使用i和j,它们分别被赋值1和2,这和在脚本中定义变量是一样的


$ awk 'BEGIN{FS=":"; OFS=" "; ORS="\n"} {print $1} END{print NR}' passwd

root

bin

daemon

adm

lp

5

BEGIN和END中的代码快分别在匹配文件之前和之后执行,FS,OFS,ORS,NR都是awk的内建变量

上例的意思是将分割符设为:,输出分割符为空格,换行符为行之间的分隔符,NR代表匹配的行数


$ awk -F ":" '$3==0 {print $0 > "root.txt" }' passwd

使用重定向将结果输出到root.txt中


$ awk -F ":" '{if($3==0){print "yes"} else {print "no"}}' passwd

yes

no

no

no

no

awk中的条件判断语句

if(expr){

    statment;

}else{

    statment;

}


$ awk -F ":" '$1~/root/{for (i=1; i < NF; i++) print i,$i}' passwd

1 root

2 x

3 0

4 0

5 root

6 /root

for循环语句

awk -F ":" '$1~/root/{i=1;while(i < NF){print i,$i;i++}}' passwd

使用while打印出与上面的for语句一样的结果


$ awk -F ":" '{gsub(/root/, "david"); print}' passwd

david:x:0:0:david:/david:/bin/bash

bin:x:1:1:bin:/bin:/sbin/nologin

daemon:x:2:2:daemon:/sbin:/sbin/nologin

adm:x:3:4:adm:/var/adm:/sbin/nologin

lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin

使用awk的内建函数,将root替换为david




参考文档:

IBM的awk实例

http://www-128.ibm.com/developerworks/cn/linux/shell/awk/awk-1/

http://www-128.ibm.com/developerworks/cn/linux/shell/awk/awk-2/

http://www-128.ibm.com/developerworks/cn/linux/shell/awk/awk-3/
阅读(2299) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~