try vuuv.github.io or somewhere else.
分类:
2011-10-07 15:01:18
原文地址:awk之RT内置变量 作者:zooyo
要求以上文本中出现过的数字相加。
[解析]
把RS记录分割符设置成一个正则,匹配一个或多个数字的字符段为记录分割符。RT就是当RS为正则表达式时的匹配到的每个记录的分割符的内容即为RT变量表示。那么把RT累加给变量s,然后最后输出该值。达到了把所有文本中出现过的数字相加。这里还有一个小细节不要放过,就是 + 号,该符号在BREs正则表达式中是不支持这样写的正确的写法是 \+ ,但是awk默认是使用的EREs正则表达式,所以支持 + 号的写法,大家注意区分。
文本内容如下,现在想获取begin和end之间同时含有BBCC、EEFF两个字符串的段,并打印出来。
begin
AABB
AACC
end
begin
BBCC
EEFF
end
begin
ABCD
HIGJ
end
begin
ABCD
ABEF
end
打印结果应为:
begin
BBCC
EEFF
end
[解析]
为什么RT是end?阁下想明白了吗?
如何抽取匹配行下第三行不为空时,匹配行下面三行行内容:
把匹配行指定的域内容提取出来添加到输出结果中: 3 111 |
[解析]
把每段文本的开始标记行作为RS,不难了吧。