正则表达式深入理解-CUTianrui007-ChinaUnix博客

诗&amp;艺&amp;技tianrui007.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

CUTianrui007

博客访问： 411982
博文数量： 57
博客积分： 193
博客等级：入伍新兵
技术积分： 1192
用户组：普通用户
注册时间： 2012-12-13 14:37

个人简介

当以艺术眼光看程序，寻找程序后面的原理，做到化而不忘

文章分类

全部博文（57）

Excel（1）
Linux（4）
词源（1）
Python（7）
Embedded（4）
ReadingAndThinki（22）
Reversing（1）
Reversing（1）
MFC（2）
Architecture（1）
CANRelated（1）
C/C++（6）
Perl（5）
未分配的博文（1）

文章存档

2017年（5）

2015年（7）

2014年（27）

2013年（18）

我的朋友

相关博文

正则表达式深入理解

分类： Windows平台

2014-06-08 18:26:41

正则表达式，匹配过程可理解如下：

1：匹配内容

学名叫字符组，想匹配什么内容，字母\w，数字\d，符号，是否要转义。是单个匹配还是要使用分组（括号），分组是否要命名。

2：匹配数量

多少次，*+?的使用，具体数量限定｛m,n｝。

3：匹配位置

是行开头还是结束，^，$，是否是单词边界\b。

4：模式

单行模式还是多行模式

一些小技巧：

1：查找某个字符，假定某个字符在N位，那也就是意味着N位前不能出现，N位出，也就是说，查找字符本质上是查找两部分：非本字符和本字符。所以匹配的内容也有两部分，正则表达式如下：[^某个字符][某个字符]*。注意一下，这里有个隐含字符的现象，表面上是你匹配本字符，实际上还要匹配非本字符。

2：正则表达式又叫最小的编程语言，比如和C相比，C中有Int，char等类型信息，对应到正则表达式中，则就是上面的四点。每个部分都有相应的类型符号，可以认为是像C中的数据类型一样。

比如*+?{m,n}，其类型就是数量，[]其类型就是匹配内容，?x(x表示m等模式标志)其类型是匹配模式。可以这样认为：它是通过符号来表示类型的，这个在具体的语言中体现的特别明显。比如，PowerShell，数组是用@()，HashTable用@{}。一般变量用$。权且叫做类型符号化吧。正则表达式匹配的过程就是查找并定位类型的过程。

阅读(1570) | 评论(0) | 转发(0) |

上一篇：异步机制是如何实现的

下一篇：正则表达式环视理解

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6