Chinaunix首页 | 论坛 | 博客
  • 博客访问: 131301
  • 博文数量: 41
  • 博客积分: 15
  • 博客等级: 民兵
  • 技术积分: 65
  • 用 户 组: 普通用户
  • 注册时间: 2012-12-11 16:17
文章分类
文章存档

2017年(1)

2016年(5)

2015年(8)

2014年(13)

2013年(10)

2012年(4)

我的朋友

分类: LINUX

2014-12-28 13:09:34

原文地址:awk之支持posix字符集 作者:zooyo

文本:
a1
b22
c333
C333
d4444
eeeee
fff
 
POSIX字符集:

[:alnum:]  文字数字字符
[:alpha:]  文字字符
[:digit:]  数字字符
[:graph:]  非空字符(非空格、控制字符)
[:lower:]  小写字符
[:cntrl:]  控制字符
[:print:]  非空字符(包括空格)
[:punct:]  标点符号
[:space:]  所有空白字符(新行,空格,制表符)
[:upper:]  大写字符
[:xdigit:] 十六进制数字(0-9,a-f,A-F)

 

要在awk中开启支持posix类字符,需要多加一对中括号比如

  1. awk '/[[:lower:]]/' file
  2. a1
  3. b22
  4. c333
  5. d4444
  6. eeeee
  7. fff
这样就过滤掉了大写的C的行,awk本身就支持扩展正则表达式的,所以如果要过滤一个小写字母开头后面是数字的行呢就可以这样表达
  1. awk '/[[:lower:]][0-9]+/' file
  2. a1
  3. b22
  4. c333
  5. d4444
如果还要精确范围类似我们说的正则表达式的x\{m,n\}呢,这时候需要开启posix支持:
  1. awk --posix '/[[:lower:]][0-9]{1,2}$/' file
  2. a1
  3. b22

  4. awk --re-interval '/[[:lower:]][0-9]{1,2}$/' file
  5. a1
  6. b22
阅读(1241) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~