awk 之处理多行的数据（十二）-szufhc2006-ChinaUnix博客

爪杉jarsonfang.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

szufhc2006

博客访问： 518377
博文数量： 119
博客积分： 5054
博客等级：大校
技术积分： 1305
用户组：普通用户
注册时间： 2010-01-03 13:13

文章分类

全部博文（119）

Embed_dev（18）
LFS（3）
Life（1）
IPtables（4）
Linux（27）
Misc（15）
Shell（29）

Tools（0）

Bash（13）

Awk&Sed（16）
Ubuntu（21）
未分配的博文（1）

文章存档

2011年（4）

2010年（115）

我的朋友

最近访客

推荐博文

awk 之处理多行的数据（十二）

分类：

2010-01-03 21:21:57

awk 每次从数据文件中只读取一数据进行处理.

awk是依照其内建变量 RS(Record Separator) 的定义将文件中的数据分隔成一行一行的Record. RS 的默认值是 “\n”(换行符号), 故平常awk中一行数据就是一笔 Record. 但有些文件中一笔Record涵盖了多行数据, 这种情况下不能再以 “\n” 来分隔Records. 最常使用的方法是相邻的Records之间改以一个空白行来隔开. 在awk程序中, 令 RS = “”(空字符串)后, awk把会空白行当成来文件中Record的分隔符. 显然awk对 RS = “” 另有解释方式,简略描述如下, 当 RS = “” 时:数个并邻的空白行, awk仅视成一个单一的Record Saparator. (awk不会于两个紧并的空白行之间读取一笔空的Record)

awk会略过(skip)文件头或文件尾的空白行. 故不会因为这样的空白行,造成awk多读入了二笔空的数据.

请观察下例,首先建立一个数据文件 week.rpt如下:

张长弓
GNUPLOT 入门

吴国强
Latex 简介
VAST-2 使用手册
mathematic 入门

李小华
awk Tutorial Guide
Regular Expression

该文件的开头有数行空白行, 各笔Record之间使用一个或数个空白行隔开. 读者请细心观察,当 RS = “” 时, awk读取该数据文件之方式.

编辑一个awk程序文件 make_report如下:

#!/bin/sh

awk '
BEGIN {
FS = "\n"
RS = ""
split( "一. 二. 三. 四. 五. 六. 七. 八. 九.", C_Number, " " )
}
{
printf("\n%s 报告人 : %s \n",C_Number[NR],$1)
for( i=2; i <= NF; i++) printf(" %d. %s\n", i-1, $i)
} ' $*

执行

$ make_report week.rpt

屏幕产生结果如下:

一. 报告人 : 张长弓
 1. GNUPLOT 入门

二. 报告人 : 吴国强
 1. Latex 简介
 2. VAST-2 使用手册
 3. mathematic 入门

三. 报告人 : 李小华
 1. awk Tutorial Guide
 2. Regular Expression

[ 说明: ]

本程序同时也改变字段分隔字符( FS= "\n" ), 如此一笔数据中的每一行都是一个field. 例如: awk读入的第一笔 Record 为

张长弓
GNUPLOT 入门

其中 $1 指的是"张长弓", $2 指的是"GNUPLOT 入门"

上式中的C_Number[ ]是一个数组(array), 用以记录中文数字. 例如: C_Number[1] = "一.", C_Number[2] = "二." 这过程使用awk字符串函数 split( ) 来把中文数字放进数组 C_Number[ ]中.

函数 split( )用法如下:

split( 原字符串, 数组名, 分隔字符(field separator) ) : awk将依所指定的分隔字符(field separator)分隔原字符串成一个个的字段(field), 并以指定的数组记录各个被分隔的字段

阅读(1241) | 评论(0) | 转发(0) |

上一篇：awk 之程序应用实例（十一）

下一篇：awk 之读取命令行上的参数（十三）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6