awk中sub函数的用法一例-binary

binary_XY.Z的ChinaUnix博客binary.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

binary_XY.Z

博客访问： 1517408
博文数量： 263
博客积分： 10851
博客等级：上将
技术积分： 2627
用户组：普通用户
注册时间： 2008-11-26 22:40

文章分类

全部博文（263）

终端开发（3）

android（2）
问题集（1）
linux桌面应用（2）
linux内核（13）

内核开发（1）

内核管理（12）
龙套箱（1）
虚拟技术（9）

xen（1）

vmware（8）
linux网络安全（22）

网络其他（2）

netfilter/iptabl（4）

网络基础（16）
数据库（20）

oracle（0）

mysql（20）
团队建设（2）
linux大杂烩（10）
linux系统管理（95）

lvs + heartbeat（11）

rpm（5）

包管理工具（0）

工具集（2）

vsftpd（2）

nginx（8）

rsync（5）

cacti（0）

resin（0）

apache（2）

nagios（0）
linux编程开发（27）

java web开发（1）

java（2）

系统编程（8）

php（3）

c/c++（11）
linux脚本（57）

tcl与expect（2）

perl（0）

bash（54）
未分配的博文（1）

文章存档

2013年（4）

2012年（25）

2011年（33）

2010年（50）

2009年（138）

2008年（13）

我的朋友

相关博文

awk中sub函数的用法一例

分类： LINUX

2008-12-09 23:30:11

有一文本：

... ...

以'|'为分隔，现要将第二个域字母前的数字去掉，其他地方都不变，输出为：

... ...

解法：

awk -F '|' 'BEGIN{ OFS="|" } {sub(/[0-9]+/,"",$3);print $0}' data_file

awk -F '|' -v OFS='|' '{sub(/[0-9]+/,"",$3);print $0}' data_file

其他方法：

awk的sub函数用法：
sub函数匹配指定域/记录中最大、最靠左边的子字符串的正则表达式，并用替换字符串替换这些字符串。
如果没有指定目标字符串就默认使用整个记录。替换只发生在第一次匹配的时候。格式如下：
                  sub (regular expression, substitution string):
                  sub (regular expression, substitution string, target string)
      实例：
                  $ awk '{ sub(/test/, "mytest"); print }' testfile
                  $ awk '{ sub(/test/, "mytest"); $1}; print }' testfile
      第一个例子在整个记录中匹配，替换只发生在第一次匹配发生的时候。
      第二个例子在整个记录的第一个域中进行匹配，替换只发生在第一次匹配发生的时候。

如要在整个文件中进行匹配需要用到gsub
      gsub函数作用如sub，但它在整个文档中进行匹配。格式如下：
                  gsub (regular expression, substitution string)
                  gsub (regular expression, substitution string, target string)
      实例：
                  $ awk '{ gsub(/test/, "mytest"); print }' testfile
                  $ awk '{ gsub(/test/, "mytest"), $1 }; print }' testfile
      第一个例子在整个文档中匹配test，匹配的都被替换成mytest。
      第二个例子在整个文档的第一个域中匹配，所有匹配的都被替换成mytest。

另外，只有当记录中的域有改变的时候，指定0FS变量才有用，如果记录中的域无变化，指定OFS产生不了实际效果。

awk -F'|' -v OFS='|' '{ gsub(/[0-9]/, "", $3); print $0; }' data.txt将把第三个域中所有数字都去掉。

另外，对于数字的匹配，可以使用十六进制：

awk -F'|' -v OFS='|' '{ gsub(/[\x30-\x39]/, "", $3); print $0; }' data.txt

阅读(3438) | 评论(0) | 转发(0) |

上一篇：头脑风暴的规则

下一篇：在ls中列出文件的绝对路径

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6