awk 之內建变量 Built-in Variables（八）-szufhc2006-ChinaUnix博客

爪杉jarsonfang.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

szufhc2006

博客访问： 522385
博文数量： 119
博客积分： 5054
博客等级：大校
技术积分： 1305
用户组：普通用户
注册时间： 2010-01-03 13:13

文章分类

全部博文（119）

Embed_dev（18）
LFS（3）
Life（1）
IPtables（4）
Linux（27）
Misc（15）
Shell（29）

Tools（0）

Bash（13）

Awk&Sed（16）
Ubuntu（21）
未分配的博文（1）

文章存档

2011年（4）

2010年（115）

我的朋友

最近访客

推荐博文

awk 之內建变量 Built-in Variables（八）

分类：

2010-01-03 21:03:19

因內建变量的个数不多, 此处按其相关性分类说明, 并未按其字母顺序排列.

ARGC
ARGC表示命令行上除了选项 -F, -v, -f 及其所对应的参数之外的所有参数的个数.若将”awk程式”直接写於命令列上, 则 ARGC 亦不将该”程式部分”列入计算.

ARGV
ARGV数组用以记录命令列上的参数.
例 : 执行下列命令

$ awk  -F\t -v a=8 -f prg.awk  file1.dat file2.dat

或

$ awk  -F\t -v a=8 '{ print $1 * a }' file1.dat file2.dat

执行上列任一程式后

ARGC    =  3
ARGV[0] = "awk"
ARGV[1] = "file1.dat"
ARGV[2] = "file2.dat"

读者请留心 : 当 ARGC = 3 时, 命令列上仅指定了 2 个文件.
注 :
-F\t 表示以 tab 为栏位分隔字符 FS(field seporator).
-v a=8 是用以初始化程序中的变量 a.

FILENAME
FILENAME用以表示目前正在处理的文件档名.

FS
栏位分隔字符.

$0
表示目前awk所读入的数据行.

$1,$2..
分別表示所读入的数据行之第一栏, 第二栏,..
说明:
当awk读入一笔数据行 “A123 8:15″ 时,会先以$0 记录.
故 $0 = “A123 8:15″
若程序中进一步使用了 $1, $2.. 或 NF 等內建变量时, awk才会自动分割 $0.
以便取得栏位相关的资料. 切割后各个栏位的资料会分別以$1, $2, $3…予以记录.
awk內定(default)的栏位分隔字符(FS) 为空白字符(空格及tab).
以本例而言, 读者若未改变 FS, 则分割后:
第一栏($1)=”A123″, 第二栏($2)=”8:15″.
使用者可用正则表达式自行定义 FS. awk每次需要分割数据行时, 会参考目前FS的值.
例如 :
令 FS = “[ :]+” 表示任何由空白” ” 或冒号”:” 所组成的字串都可当成分隔字符, 则分割后 :
第一栏($1) = “A123″, 第二栏($2) = “8″, 第三栏($3) = “15″

NR
NR 表从 awk 开始执行该程序后所读取的数据行数.

FNR
FNR 与 NR 功用类似. 不同的是awk每打开一个新的文件,FNR 便从 0 重新累计

NF
NF表目前的数据行所被切分的栏位数.
awk 每读入一笔资料后, 在程序中可以 NF 来得知该行数据包含的栏位个数.在下一笔资料被读入之前, NF 并不会改变. 但使用者若自行使用$0来记录数据,例如: 使用 getline , 此时 NF 将代表新的 $0 上所记载的资料的栏位个数.

OFS
OFS输出时的栏位分隔字符. 预设值 ” “(一个空白), 详见下面说明.

ORS
ORS输出时数据行的分隔字符. 预设值 “\n”(跳行), 见下面说明.

OFMT
OFMT数值资料的输出格式. 预设值 “%.6g”(若须要时最多印出6位小数)
当使用 print 指令一次印出多项资料时,
例如 : print $1, $2
输出时, awk会自动在 $1 与 $2 之间补上一个 OFS 之值
每次使用 print 输出后, awk会自动补上 ORS 之值.
使用 print 输出数值数据时, awk将采用 OFMT 之值为输出格式.
例如 :

$ awk 'BEGIN { print 2/3,1; OFS=":"; OFMT="%.2g"; print 2/3,1 }'

输出:

0.666667 1
0.67:1

程序中通过改变OFS和OFMT的值, 改变了指令 print 的输出格式.

RS
RS( Record Separator) : awk从文件上读取资料时, 将根据 RS 的定义把资料切割成许多Records,而awk一次仅读入一个Record,以进行处理.
RS 的预设值是 “\n”. 所以一般 awk一次仅读入一行资料.
有时一个Record含括了几行资料(Multi-line Record). 这情況下不能再以”\n”
来分隔相邻的Records, 可改用空白行来分隔.
在awk程式中,令 RS = “” 表示以空白行来分隔相邻的Records.

RSTART
RSTART与使用字串函数 match( )有关的变量,详见下面说明.

RLENGTH
RLENGTH与使用字串函数match( )有关之变量.
当使用者使用 match(…) 函数后, awk会将 match(…) 执行的结果以RSTART,RLENGTH 记录.
请参考 awk 之內建函数 match().

SUBSEP
SUBSEP(Subscript Separator) 数组下标的分隔字符,
预设值为”\034″实际上, awk中的数组只接受字串当它的下标,如: Arr["John"].
但使用者在 awk 中仍可使用数字当阵列的下标, 甚至可使用多维的数组(Multi-dimenisional Array) 如: Arr[2,79]
事实上, awk在接受 Arr[2,79] 之前, 就已先把其下标转换成字串”2\03479″, 之后便以Arr["2\03479"] 代替 Arr[2,79].
可参考下例 :

awk 'BEGIN {
Arr[2,79] = 78
print  Arr[2,79]
print  Arr[ 2 , 79 ]
print  Arr["2\03479"]
idx = 2 SUBSEP 79
print Arr[idx]
}
' $*

执行结果输出:

阅读(963) | 评论(0) | 转发(0) |

上一篇：awk 之Actions(七)

下一篇：awk 之內建函数(Built-in Functions)（九）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6