vi 中的正则表达式-lc0060305-ChinaUnix博客

李庚睿（lgr）的博客 -- 蔚蓝天空garry.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

lc0060305

博客访问： 3582331
博文数量： 1450
博客积分： 11163
博客等级：上将
技术积分： 11101
用户组：普通用户
注册时间： 2005-07-25 14:40

文章分类

全部博文（1450）

音视频直播（2）
linux各种服务器（3）
ARM学习（8）

ARM汇编指令（7）
手机开发（230）

android（2）

iphone（4）

symbian（224）
nginx 分析（6）
vi常用方法（13）
linux 常用命令（65）

linux shell 脚本（38）
window批处理资料（15）
黑客技术（20）

linux 系统安全（12）
搜索引擎与网络爬（32）
数据库技术（143）
网络技术（25）

网络测试方法（2）
操作系统研究（192）

android源码分析（1）

linux驱动（20）
程序设计（513）

调试技术（3）

测试方法（7）

性能调优（2）

debian（1）

JNI（5）

configure.ac（1）

Makefile.am（3）

设计模式（19）

算法与数据结构（4）

java程序开发（103）

web程序开发（41）
随笔（129）

地图集（14）

英语（4）

笑话（56）

我喜爱的诗（6）

我的小诗（4）
未分配的博文（54）

文章存档

2017年（5）

2014年（2）

2013年（3）

2012年（35）

2011年（39）

2010年（88）

2009年（395）

2008年（382）

2007年（241）

2006年（246）

2005年（14）

我的朋友

相关博文

vi 中的正则表达式

分类： LINUX

2008-06-12 09:31:16

vi 中的正则表达式 (Regular Expression)
===================================
.1. 定义和例子
============
正则表达式只是一个字符模板,用来在搜索中匹配相同的字符.
在大多数的程序中,正则表达式是括在正斜杠中间的.
例如, /love/就是一个以正斜杠为分隔符的正则表达式,其中的
模板love 将用在搜索所有行中与它匹配的字符. 更为有趣的是
正则表达式可以被特殊的元字符控制.让我们通过下面的例子来进
一步了解这个概念.
有文本如下:
Hi tom,
I think I failed my anatomy test yesterday. I
had a terrible stomach ache. I ate too many
fried green tomatoes.
Anyway, Tom, Ineed your help. I'd like to make
the test up tomorrow, but don't know where to
begin studying. Do you think you could help me?
After work, about 7 PM, come to my place and I'll
treat you to pizza in return for your help.
Thanks.
         Your pal,
         guy@phantom

假设你发觉Tom 并没有参加考试,而是David 参加的考试.同时还
发现, 在贺信中Tom的T用的是小写.于是你决定做一个全文替换,把tom
替换为Tom.

在vi命令行模式下输入:
:1, $s/tom/David/g
^ ^ ^ ^ ^
| | | | |---- global 对全文有效
| | | |
| | |--------- 将tom 替换为 David , 使用正则表达式.
| |------- 替换单词
|------ 从文件的第一行到文件的最后一行.

替换后的文本如下:
Hi David,
I think I failed my anaDavidy test yesterday, I
had terible sDavidach ache. I ate too many
fried green Davidatoes.
Anyway, David, I need your help. I'd like to make
the test up Davidorrow, but don't know where to
begin studying. Do you think you could help me?
After work, about ? PM, come to my place and
I'll treat you to pizza in return for your help.
Thanks.
      Your pal,
      guy@phanDavid

我们发现有些单词中含有tom的的也被替换了.
这是因为我们没有使用正则表达式的元字符来界定一个模板从而控制
字符的替换动作.
使用:
:1, $s/\<[Tt]om\>/David/g
就可以得到我们想要的结果了,即只替换单词tom而不是含有tom字符的
单词.

.2. 正则表达式的元字符
==================
正则表达式的元字符是一些特殊的字符,它们允许你以某种方式界定一个
模板来控制什么样的替换将发生.有的元字符锚定一个单词在行首或者行尾.
有的元字符允许你指定一个字符范围或者一些字符, 来找到大写字母, 小写字母
数字或者非数字等.

有两套正则表达式字符集, 一套是基本元字符集, 另一套是扩展元字符集.
另外, POSIX (Portable Operating System Interface for Computer Eaviron ment)
标准还提供了一套元字符集.下表提供了可以在所有版本的vi, grep, egrep, sed and gawk
中使用的基本元字符集.
表:
----------------------------------------------------------------------------------------------
元字符    | 功能          | 例子 | 匹配什么
----------------------------------------------------------------------------------------------
^    | 锚定行的开始       | /^love/ | 匹配所有以love开头的行.
----------------------------------------------------------------------------------------------
$    | 锚定行的结束       | /love$/ | 匹配所有以love结束的行.
----------------------------------------------------------------------------------------------
.    | 匹配一个字符       | /l..e/ | 匹配这样的行, 这些行包含这样的字符,
   |          |    |第一个字符是 l,紧跟着两个字符,然后是e.
-----------------------------------------------------------------------------------------------
*    | 代表0个或多个先前字符    | /*love/ | 匹配这样的行, 有0个或者多个空格,空格
   |          |    |候跟着love
-----------------------------------------------------------------------------------------------
[]    | 匹配字符组中的一个字符    | /[lL]ove/ | 匹配所有包含love or Love 的行
-----------------------------------------------------------------------------------------------
[x-y]    | 匹配以字符范围组成的组中的一个字符 | /[A-Z]ove | 匹配所有这样的行, 这些行包含如下字符
   |          |    |第一个字符是从A到Z 中间的一个, 后面跟
   |          |    |着ove
-----------------------------------------------------------------------------------------------
[^]    | 匹配一个不在范围内的字符    | /[^A-Z]ove/ | 匹配所有这样的行, 这些行包含如下字符
   |          |    |第一个字符不是从A到Z 中间的一个, 后面
   |          |    |跟着ove
-----------------------------------------------------------------------------------------------
\    | 用来转义一个字符       | /love\./ | 匹配所有这样的行, 这些行包含如下字符
   |          |    |love 后面跟着一个点, 通常点是表示任何
   |          |    |字符的通配符.
-----------------------------------------------------------------------------------------------
\<    | 锚定单词的开始       | /\    |          |    |开头的单词 (vi & grep 都支持这个功能)
-----------------------------------------------------------------------------------------------
\>    | 锚定单词的结束       | / | ... ^ ... 以love结束的单词 ... ^
-----------------------------------------------------------------------------------------------
$..$ | 标记后面用到的匹配字符    | /$love$a\1b | 最多可以使用9个标签. 第一个标签是模板
   |          |    |最左边的部分. 在这例子中, 模板love
   |          |    |保存为标签1, 后面的\1指的就是love;
   |          |    |本例子搜索的是这样的行, 这些行包含这样
   |          |    |的字符,在lovea 后面跟着loveb.
------------------------------------------------------------------------------------------------
[NOTE: 各种版本的Unix 以及模板匹配 (pattern-matching) 实用程序并不都是可信赖的, 通常我们使用 vi & grep]

假设你熟悉 vi 是怎样工作的, 每一个元字符都在 vi 搜索字符串的术语中有详细描述.
下面的例子中, 被加重的字符就是 vi 将找到的匹配字符.

文本如下:
I had a lovely time on our little picnic.
Lovers were all around us. It is springtime. Oh
Love, how much I adore you. Do you know
the extent of my love? Oh, by the way, I think
I lost my gloves somewhere out in that field of
clover. Did you see them? I can only hope love
is forever. I live for you. It's hard to get back
in the groove.
~
~
~
/love/

结果如下:
I had a lovely time on our little picnic.
   ^
Lovers were all around us. It is springtime. Oh
^
Love, how much I adore you. Do you know
^
the extent of my love? Oh, by the way, I think
^
I lost my gloves somewhere out in that field of
^
clover. Did you see them? I can only hope love
^ ^
is forever. I live for you. It's hard to get back
in the groove.

//
还有一些测试命令如下:
/^love/
/love$/
/l.ve/
/[lL]ove/
/ove[a-z]/
/ove[^a-zA-Z0-9]/

//
//:~ Tue 22 Apr 2003 11:42:51 PM CST
//:~ End Of PAGE 1

阅读(597) | 评论(0) | 转发(0) |

上一篇：vi 回引正则表达式

下一篇：vi 中的正则表达式

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6