基础正则表达式字符-308938969-ChinaUnix博客

南城NOTE

首页　| 　博文目录　| 　关于我

308938969

博客访问： 1776714
博文数量： 782
博客积分： 2455
博客等级：大尉
技术积分： 4140
用户组：普通用户
注册时间： 2011-04-06 21:37

个人简介

Linux ,c/c++, web，前端，php，js

文章分类

全部博文（782）

PHP（14）
前端（2）
owner（6）
openwrt嵌入式（11）
负载均衡（14）
线程和进程（3）
项目管理（2）
MAKEFILE（2）
数据库（3）
linux kernel（27）
协议栈（13）
数据结构和算法（2）
linux CMD（11）
C++（3）
C PROG（19）
shell（5）
DNS BIND（10）
STUDY NOTE（18）
未分配的博文（617）

文章存档

2015年（8）

2014年（28）

2013年（110）

2012年（307）

2011年（329）

我的朋友

最近访客

推荐博文

基础正则表达式字符

分类：

2012-05-03 09:06:32

原文地址：基础正则表达式字符作者：windtunnel

一、待查找的字符串（word）在行首

RE字符：^word
范例：查找行首为#开始的那一行，并列出行号(grep 后带 -n 的作用)
命令：grep -n '^#' regular_express.txt

二、待查找的字符串（word）在行尾

RE字符：word$
范例：将行尾为!的那一行打印出来，并列出行号
命令：grep -n '!$' regular_express.txt

三、代表一定有一个任意字符的字符

RE字符：.
范例：查找字符串可以是(eve)(eae)(eee)(e e)，但不能有(ee)！即e与e中间一定“有且仅有”一个字符，而空格也是字符
命令：grep -n 'e.e' regular_express.txt

四、转义字符，将特殊符号(比如^ $ . \ * [ ]等等)的特殊意义去除

RE字符：\
范例：查找含有单引号 ' 的那一行
命令：grep -n '\'' regular_express.txt #注意\后面是个单引号，而非一个双引号

五、重复零个到无穷多个的前一个字符

RE字符：*

范例：找出含有（es）（ess）（esss）等的字符串，注意，因为*可以是0个，所以 es 也是符合待查找字符串。另外，因为 * 为重复“前一个RE字符”的符号，因此，在*之前必须紧接着一个RE字符。例如任意字符则为".*"（注意星号前面是一个英文句号，因为英文句号代表“有且仅有一个任意字符”）。

命令：grep -n 'ess*' regular_express.txt #因为*可以是0个，所以 es 也是符合待查找字符串

六、从字符集合的RE字符里面找出想要选取的字符

RE字符：[list]

范例：查找含有（gl）或（gd）的那一行，需要特别留意的是，在[ ]当中代表一个待查找的字符，例如"a[afl]y"代表查找的字符串可以是aay、afy、aly，即[afl]代表的是a或f或l的意思。

命令：grep -n 'g[ld]' regular_express.txt

七、从字符集合的RE字符里面找出想要选取的字符范围

RE字符：[n1-n2]

范例：查找含有任意数字的那一行。需要特别注意的是，在字符集合[ ]中的减号-是有特殊意义的，它代表两个字符之间的所有连续字符。但这个连续与否与ASCII编码有关，因此，你的编码需要设置正确（在bash当中，需要确定LANG与LANGUAGE的变量是否正确）！例如所有大写字符则为[A-Z]。

命令：grep -n '[0-9]' regular_express.txt #查找含有任意数字的那一行

grep -n '[A-Z]' regular_express.txt #查找含有任意大写字母的那一行

八、从字符集合的RE字符里面找出不要的字符串或范围

RE字符：[^list]

范例：查找的字符串可以是（oog）（ood）但不能是（oot），那个^在[ ]内代表的意义是”反向选择“的意思。例如，我不要大写字母，则为[^A-Z]。但是，需要特别注意的是，如果以 grep -n [^A-Z] regular_express.txt 来查找，却发现该文件内的所有行都被列出，为什么？因为这个[^A-Z]是”非大写字符“的意思，因为每一行均有非大写字母。

命令：grep -n 'oo[^t]' regular_express.txt

九、连续n到m个的前一个RE字符，若为\{n\}则是连续n个的前一个RE字符，若为\{n,\}则是连续n个以上的前一个RE字符

RE字符：\{n,m\}

范例：在g与g之间有2个到3个的o存在的字符串，即（goog）（gooog）

命令：grep -n 'go\{2,3\}g' regular_express.txt

再次强调：正则表达式的特殊字符与一般在命令行输入命令的”通配符“并不相同。例如，在通配符中的*代表的是零到无限多个字符的意思，但是在正则表达式当中，*则是重复0到无穷多个的前一个RE字符的意思，使用的意义并不相同，不要搞混了！

举例来说，在不支持正则表达式的ls这个工具中，我们使用”ls -l *“代表的是任意文件名的文件，而”ls -l a*“代表的是以a开头的任何文件名的文件，但在正则表达式中，我们要找到含有以a为开头的文件，则必须要这样（需搭配支持正则表达式的工具）：

ls | grep -n '^a.*'

阅读(647) | 评论(0) | 转发(0) |

上一篇：两种禁ping的方法

下一篇：opendpi手册（读书笔记）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6