分类: PHP
2013-05-07 08:55:40
第一、正则表达式,也称为模式表达式,它有自己一套完整编写规范。
正则表达式的用途:正则表达式主要是用来对字符串进行匹配、查找、替换和分割等操作。
第二、正则表达式主要是由四部分组成:定界符、原子、元字符和模式修正符。
1.定界符:除了数字、字母和反斜线(\)以外的任意一个字符都可以作为定界符来使用。
2.原子:
普通字符 即:[a-z][A-Z][0-9]
特殊字符 比如:*
+ ? [ ]...
在使用这些字符来匹配本意的时候,需要加上转义字符'\'。
非打印字符
\f---------------分页符
\r---------------换行符
\n---------------回车符
\t---------------水平制表符
\v---------------垂直制表符
通用字符类型
\d---------------匹配[0-9]
\D---------------匹配除了[0-9]以外的任意一个字符
\s---------------匹配空白字符(例:\f
\r \n \t
\v等等)
\S---------------匹配队了空白字符以外的任意一个字符
\w---------------匹配数字、字母、下划线
\W---------------匹配除了数字、字母、下划线以外的任意一个字符
原子表
[]---------------表示匹配[]以内的任意一个字符,可以理解为可以组成一个新的集合,例:[abc]匹配a或b或c其中一个。
[^]--------------表示除了其以内的字符以外的任意一个字符。
3.元字符 元字符是用来修饰原子的,不能单独出现在正则表达式中。
限定符
*----------------表示匹配其前面的原子0次1次或多次
+----------------表示匹配其前面的原子1次或多次
?----------------表示匹配其前面的原子0次或1次
{n}--------------表示被匹配的对象恰好出现多少次
{n,}-------------表示被匹配的对象至少出现n次
{n,m}------------表示被匹配的对象至少出现n次,最多出现m次
边界限制
^----------------表示必须以其后面的原子开头
$----------------表示必须民其前面的原子结束
\A---------------同^
\Z---------------同$
\b---------------表示匹配词边界
\B---------------表示匹配词边界以外的部分
句号
.----------------匹配除了换行符以外的任意一个字符
模式选择符
|----------------表示匹配两个或多个分支选择
模式单元
()---------------括号内的字符将会被看成是一个整体,也就也相当于一个大原子。
4.模式修正符 放在正则表达式定界符之后来使用,定义了正则表达式的匹配方式。
i-----------------不区分大小写
m-----------------视为多行
s-----------------视为一行
U-----------------贪婪和非贪婪之间互转
以上是正则表达式的基础的、常用的一些字符。想学会正则表达式,先把这些字符的意义先记住了,勤练习,多动手,你将会完美学会正则表达式。如有疑惑,请到兄弟连教学部咨询莫楠老师。
原文地址: