linux grep + 基础正则表达式-nba76ers-ChinaUnix博客

Arvil to dreamiforeverlove.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

nba76ers

博客访问： 2902437
博文数量： 471
博客积分： 7081
博客等级：少将
技术积分： 5369
用户组：普通用户
注册时间： 2012-01-04 21:55

文章分类

全部博文（471）

web开发（1）
app开发（4）
tomcat（8）

tomcat配置（8）
Tomcat优化（2）
架构类（4）
gpddddddi（2）
python（32）

经典面试题目（4）

应用开发（1）

python 的we（2）

透彻python编程（14）

python简明教程（10）
web前端开发（8）

css（2）

JS（1）

html（4）
运维自动化（3）

fabric（1）
系统设计题（0）
C的底层知识（0）
智力研究（0）
概率（3）
百度（0）
数组（8）
位存储（3）
递归（0）
算法题（8）
操作系统（2）
java百练（9）
sql百练（13）
linux笔试（4）

linux shell编程（2）

linux面试题（0）
acm总结（3）
图的算法（24）

最大二分匹配（3）

每对顶点间的最短（0）

单源最短路径（2）

最小生成树（4）

拓扑排序（2）

BFS广度优先搜索（6）

DFS深度优先搜索（6）

搜索专题（1）
数据结构（44）

外部排序（1）

stl Map（1）

二叉树（6）

递归专题（0）

堆（0）

优先队列（3）

八大排序与三大查（4）

最优二叉树(哈夫（0）

字符串（8）

B树（0）

红黑树（0）

栈和队列（4）

并查集（不相交集（0）

二叉查找树（4）

Hash散列表（6）

字典树（3）

链表（4）
收集面试（6）
acm（28）

二分搜索专题（3）

快速取幂算法（1）

递推专题（2）

背包问题（2）

贪心算法（3）

动态规划（2）

简单计算（7）

打表（1）

母函数（7）
mysql（85）

sql练习（12）

mysql配置文件优（5）

mysql维护管理（11）

mysql SQL语（9）

性能优化（17）

mysql入门很简单（31）
beautyofprogramm（0）

topK（0）
little java（4）
海量数据专题（2）
spring2.5（15）
struts2（3）
hadoop（4）
java（59）

spring（3）

JVM原理（4）

收集公司笔试（2）

java组件（1）

javaIO（3）

JDK底层实现（5）

jvm 优化系列（3）

线程系列（7）

java反射系列（12）

java 基础用法注（19）
网络编程（20）
linux基础（54）

awk（0）

sed（3）

Linux Shell（18）

linux编程环境（5）

进程管理与监控（8）

linux常用命令解（20）
未分配的博文（6）

文章存档

2014年（90）

2013年（69）

2012年（312）

我的朋友

相关博文

linux grep + 基础正则表达式

分类： LINUX

2013-02-24 10:19:06

.   句点表示任何单个字符
[]  方括号包括一个字符序列
-   短横线在字符之间使用以创建一个序列（在 [] 内）
^   脱字符用于对序列（在 [] 内）取反
*   星号搜索某个搜索项的零个、一个或多个实例
?   问号搜索某个搜索项的零个或一个实例
+   加号搜索某个搜索项的一个或多个实例
$   美元符号搜索行尾
^   脱字符搜索行首
\   特殊字符前的反斜杠使该字符成为普通字符

\< 从匹配正则表达式的行开始
\> 到匹配正则表达式的行结束

使用方括号

下一步，试验一些上面讨论过的特殊字符。您可以使用方括号（方括号表达式）来指示您想要搜索 golf 和 Golf：

grep -n '[gG]olf' grep.txt

1:I like golf.
2:Golf is played on grass.

句点

若要搜索 golf 和 gilf，您同样可以使用方括号。取而代之的是，可以尝试使用一个句点来指示您想要搜索 g 和 lf 之间的任何字符：

# grep -n 'g.lf' grep.txt
1:I like golf.
3:I created gilf.

搜索 golf、Golf 和 gilf您现在已经找到了获得每种 golf 变体的方法，但是还没有哪个搜索返回了所有三个实例：golf、Golf 和gilf。花点时间考虑一下如何搜索所有三个实例。这可以通过多种方法来实现。下面是两个示例：

# grep -n '[gG][oi]lf' grep.txt
1:I like golf.
2:Golf is played on grass.
3:I created gilf.

短横线

您是否能够想出更多的方法来完成此任务呢？到目前为止，您仅学习了两个在正则表达式中使用的特殊字符。这只是开始！有些特殊字符在其他特殊字符之内使用。例如，当您将一组字符包括在方括号中时，您可以使用短横线 
(-) 来搜索一系列字符。将以下行添加到您的文本文件：

What is g2lf?

使用您到目前为止已学到的知识，您知道如果使用类似于 g.lf 或 g[oi2]lf 的正则表达式，则这一行将包括在搜索结果中。使用句点将返回在该位置具有任何字符的结果；使用 [oi2] 将返回仅在该位置具有 o i 或 2 的结果。通过使用一个短横线，您可以实现第三种方法，其中不只包括少数字符，但并不是包括每个字符：

grep g[a-z]lf

此方法产生以下输出：

I like golf.
I created gilf.

从输出中可以看到，此方法搜索落在 a 和 z 之间的任何字符（按字母顺序）。这排除了在 g 和 lf 之间具有数字或符号的字符串，这些字符串不是真正的单词，可能不属于您所需的搜索条件。

方括号中的短横线

通过在方括号中包括附加集合，您还可以搜索多个字符序列。例如，若要搜索 a-z 和 A-Z，可以使用以下搜索：

# grep -n g[a-zA-z]lf grep.txt
1:I like golf.
3:I created gilf.

在方括号内使用脱字号 (^)

当您的字符序列列表变得更长时，可能发现通过避免某些字符而不是指定想要查找的字符来进行搜索会更容易。这可以通过在搜索序列前在方括号中使用脱字符 (^) 来实现。这说起来挺复杂的，但是通过观察一个示例，应该是很容易理解的。通过使用以下 grep 命令来更改您的搜索，以避免数字但是包括所有其他字符：

]# grep -n g[^0-9]lf grep.txt
1:I like golf.
3:I created gilf.

	此搜索类似于前面查找所有字母字符的搜索，但是此搜索还返回诸如数字符号 (#) 和美元符号 ($) 等不属于字母并且也不在您排除的数字序列中的字符。

星号

要试验的下一个特殊字符是星号 (*)，它是若干个重复操作符之一。大多数人都非常熟悉在命令行上使用星号作为文件名搜索条件（通配符），但是在正则表达式中使用星号还是相当新鲜的。星号指示搜索项（前一个字符或方括号表达式）可以出现零次、一次或多次。若要对此进行尝试，请将以下行添加到您已经在使用的 grep.txt 文件：

This time the o is missing in glf.
Some people might say goolf.
But they would not say goilf.

现在整个文件应该类似如下：

I like golf.
Golf is played on grass.
I created gilf.
What is g2lf?
This time the o is missing in glf.
Some people might say goolf.
But they would not say goilf.

尝试在 golf 中的 o 后面使用星号：

grep go*lf grep.txt

您的搜索将返回具有单词 golf、glf 和 goolf 的行：

# grep -n go*lf grep.txt
1:I like golf.
5:This time the o is missing in glf.
6:Some people might say goolf.

问号

另一个重复操作符是问号 (?)。问号的功能与星号类似，只不过搜索项可以出现零次或一次。多个实例将不匹配。使用问号取代星号来尝试您刚才执行的搜索：

grep go?lf grep.txt

可以看到，这次作为匹配结果返回了 golf 和 glf，但是没有返回 goolf，因为其中存在问号前的搜索项 o 的多个实例：

I like golf.
This time the o is missing in glf.

加号

最后一个常规重复操作符是加号 (+)。加号将查找某个搜索项出现一次或多次的情况。与星号不同，必须至少找到一个实例才会匹配。请尝试以下示例：

grep go+lf grep.txt

这次，该搜索返回 golf 和 goolf，但它不返回 glf，因为没有找到 o：

I like golf.
Some people might say goolf.

行首和行尾定位点

在转向 sed 之前，最后要学习的特殊字符是行首定位点（使用脱字符来实现）和行尾定位点（使用美元符号来实现）。您可能记得，您在本教程的前面使用过脱字符来对方括号表达式取反。当在方括号之外使用脱字符时，它执行完全不同的功能。将脱字符放在正则表达式开头将告诉该搜索仅操作行的开头。换句话说，正则表达式中的第一个字符（脱字符之后）必须与新行上的第一个字符匹配才能匹配该行。类似地，将美元符号放在正则表达式的结尾以指示您仅希望返回与行尾匹配的结果。换句话说，正则表达式中的最后一个字符（美元符号之前）必须与某行上的最后一个字符匹配才能匹配该行。若要对此进行测试，请将以下两行添加到 grep.txt：

golf has been a fine example
let's talk about something besides golf

添加后

I like golf.
Golf is played on grass.
I created gilf.
What is g2lf?
This time the o is missing in glf.
Some people might say goolf.
But they would not say goilf.
golf has been a fine example
let's talk about something besides golf

请注意，对于此测试，您不应该对 golf 进行大写或加标点，因为它将演示一个针对同一单词的搜索，此搜索使用定位点在行尾或行首以不同的方式操作。若要测试行首定位点，请输入以下命令：

grep ^golf grep.txt

输出应该类似如下：

grep ^golf grep.txt
golf has been a fine example

若要测试行尾定位点，请使用同一个搜索，但是删除脱字符并在 golf 之后添加一个美元符号。

grep golf$ grep.txt

使用行尾定位点的输出类似如下：

# grep golf$ grep.txt
let's talk about something besides golf

反斜杠使该字符成为普通字符
grep '\#' /etc/yum.conf
# Note: yum-RHN-plugin doesn't honor this.
# Default.
# installonly_limit = 3
# PUT YOUR REPOS HERE OR IN separate files named file.repo
# in /etc/yum.repos.d

\< 从匹配正则表达式的行开始

#grep '\
keepcache=0

阅读(3054) | 评论(0) | 转发(0) |

上一篇：Grep用法小结

下一篇：标准输入输出-重定向-管道

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6