Guten&nbsp;Tag!ggyy.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

GY12345691

博客访问： 1388986
博文数量： 632
博客积分： 2778
博客等级：大尉
技术积分： 3387
用户组：普通用户
注册时间： 2012-05-31 09:09

个人简介

123

文章分类

全部博文（632）

R&S（0）
Linux（1）

Linux运维（0）
正则表达式（9）
H3C（1）
Back Track（4）
uinx（4）
selinux&iptables（18）
测试软件（16）

VMware（12）

手机（3）
Car（4）
linux 驱动（7）
CISCO（71）

zebra（1）
linux 命令（38）

linux 解压缩（4）
2012 Embedded（57）

boa伺服器（6）
say（46）
linux 编程（64）

Makefile（4）

shell（2）

perl（12）

scapy（9）

python（12）
linux文章（21）
linux教程（82）

wget（2）

centos安装软件（7）

linux 播放器（14）
linux服务器（78）

RFC（0）

DHCP（14）

ASP（1）

Cacti（10）

Nginx（2）

Nagios（1）

sendmail（4）

PHP（13）
未分配的博文（111）

文章存档

2014年（36）

2013年（33）

2012年（563）

我的朋友

正则表达式基础

在最简单的情况下，一个正则表达式看上去就是一个普通的查找串。例如，正则表达式"testing"中没有包含任何元字符，，它可以匹配"testing"和"123testing"等字符串，但是不能匹配"Testing"。

要想真正的用好正则表达式，正确的理解元字符是最重要的事情。下表列出了所有的元字符和对它们的一个简短的描述。

*元字符*		描述

`.`		匹配任何单个字符。例如正则表达式`r.t`匹配这些字符串：rat、rut、r t，但是不匹配root。
`$`		匹配行结束符。例如正则表达式`weasel$` 能够匹配字符串"He's a weasel"的末尾，但是不能匹配字符串"They are a bunch of weasels."。
^		匹配一行的开始。例如正则表达式`^When in`能够匹配字符串"When in the course of human events"的开始，但是不能匹配"What and When in the"。
*``**		匹配0或多个正好在它之前的那个字符。例如正则表达式*`.`**意味着能够匹配任意数量的任何字符。
`\`		这是引用府，用来将这里列出的这些元字符当作普通的字符来进行匹配。例如正则表达式`\$`被用来匹配美元符号，而不是行尾，类似的，正则表达式`\.`用来匹配点字符，而不是任何字符的通配符。
`[ ]` `[c1-c2]` `[^c1-c2]`		匹配括号中的任何一个字符。例如正则表达式`r[aou]t`匹配rat、rot和rut，但是不匹配ret。可以在括号中使用连字符-来指定字符的区间，例如正则表达式`[0-9]`可以匹配任何数字字符；还可以制定多个区间，例如正则表达式`[A-Za-z]`可以匹配任何大小写字母。另一个重要的用法是“排除”，要想匹配除了指定区间之外的字符——也就是所谓的补集——在左边的括号和第一个字符之间使用^字符，例如正则表达式`[^269A-Z]` 将匹配除了2、6、9和所有大写字母之外的任何字符。
`\< \>`		匹配词（word）的开始（\<）和结束（\>）。例如正则表达式`\`能够匹配字符串"for the wise"中的"the"，但是不能匹配字符串"otherwise"中的"the"。注意：这个元字符不是所有的软件都支持的。
``		将 $ 和 $ 之间的表达式定义为“组”（group），并且将匹配这个表达式的字符保存到一个临时区域（一个正则表达式中最多可以保存9个），它们可以用 `\1` 到`\9` 的符号来引用。
`\|`		将两个匹配条件进行逻辑“或”（Or）运算。例如正则表达式`(him\|her)` 匹配"it belongs to him"和"it belongs to her"，但是不能匹配"it belongs to them."。注意：这个元字符不是所有的软件都支持的。
`+`		匹配1或多个正好在它之前的那个字符。例如正则表达式`9+`匹配9、99、999等。注意：这个元字符不是所有的软件都支持的。
`?`		匹配0或1个正好在它之前的那个字符。注意：这个元字符不是所有的软件都支持的。
`\{`i`\}` `\{`i`,`j`\}`		匹配指定数目的字符，这些字符是在它之前的表达式定义的。例如正则表达式`A[0-9]\{3\}` 能够匹配字符"A"后面跟着正好3个数字字符的串，例如A123、A348等，但是不匹配A1234。而正则表达式`[0-9]\{4,6\}` 匹配连续的任意4个、5个或者6个数字字符。注意：这个元字符不是所有的软件都支持的。

正则表达式语法支持情况

命令或环境	`.`	`[ ]`	`^`	`$`	``	`\{ \}`	`?`	`+`	`\|`	`( )`
vi	X	X	X	X	X
Visual C++	X	X	X	X	X
awk	X	X	X	X			X	X	X	X
sed	X	X	X	X	X	X
Tcl	X	X	X	X	X		X	X	X	X
ex	X	X	X	X	X	X
grep	X	X	X	X	X	X
egrep	X	X	X	X	X		X	X	X	X
fgrep	X	X	X	X	X
perl	X	X	X	X	X		X	X	X	X

个人比较喜欢用awk，但是awk是不支持的  \{\} 的。不能强求。(可以用sed配合）

说明下 | 的用法，匹配多个正则式或者的关系。

awk '{if ($1 ~ /abc|123/)print $1}'

如果$1是abc或者是123就打印出来。

阅读(686) | 评论(0) | 转发(0) |

上一篇：linux grep命令参数及用法详解---linux管道命令grep

下一篇：linux 文本搜索工具-grep命令详解

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6