正则表达式 - 教程-iibull-ChinaUnix博客

牛蹄印章_VX_iibull

首页　| 　博文目录　| 　关于我

iibull

博客访问： 9672926
博文数量： 1778
博客积分： 12961
博客等级：上将
技术积分： 20371
用户组：普通用户
注册时间： 2009-01-09 11:25

个人简介

偷得浮生半桶水(半日闲), 好记性不如抄下来(烂笔头). 信息爆炸的时代, 学习是一项持续的工作.

文章分类

全部博文（1778）

TX2-NX（83）
OpenHarmony（26）
debug（374）
Python3.x（19）
AI-DeepLearning（7）
VR/AR/MR（5）
Cuda（6）
机器人（355）
GTK3 + （35）
android4.x代码分（35）
linux设备驱动第（39）
原创（50）

ER69XX项目归纳（5）
ARMLINUX技术文摘（42）

驱动（18）
Porting（73）

Delphi（12）

dotNet（13）

Meego（4）

Kernel（25）

U-BOOT（7）
代码分析（6）
移植（13）
sysfs 全接触（1）
skyeye（1）
音视频（2）
android（33）

Oracle（15）
wince（10）
linux 驱动（18）
前沿文摘（24）
GTK（11）
杂项（18）

工作（6）
日志（16）
娱乐（28）
linux 系统（46）
linux 应用（56）
armlinux（79）
未分配的博文（267）

文章存档

2025年（27）

2024年（27）

2023年（26）

2022年（112）

2021年（217）

2020年（157）

2019年（192）

2018年（81）

2017年（78）

2016年（70）

2015年（52）

2014年（40）

2013年（51）

2012年（85）

2011年（45）

2010年（231）

2009年（287）

我的朋友

相关博文

正则表达式 - 教程

分类： Windows平台

2021-05-20 17:19:44

教程

点击(此处)折叠或打开

https://www.runoob.com/regexp/regexp-tutorial.html

点击(此处)折叠或打开

把所有 H 和 C 文件中的
#incude "../../../utilities/util/include/xxx.h" 替换成 "nd_util/xxx.h"
即查找 ../../../utilities/util/include/ 替换成 nd_util/
find ./src -type f -name *.h* -o -name *.c* | xargs sed -i 's/..\/..\/..\/utilities\/util\/include\//nd_util\//g'

点击(此处)折叠或打开

https://www.cnblogs.com/ginvip/p/6352157.html
Linux三剑客（grep、sed、awk）和正则表达式的关系
https://blog.csdn.net/sj349781478/article/details/82930982

---------------------------------------------------------------------------------------------------------------

点击(此处)折叠或打开

开始学些正则表达式.
通常在使用 ? 和 * 通配符来查找硬盘上的文件。? 通配符匹配文件名中的 0 个或 1 个字符，而 * 通配符匹配零个或多个字符, 但对于复杂场合需要使用正则表达式曾精确表达

点击(此处)折叠或打开

+ 号代表前面的字符必须至少出现一次（1次或多次）
* 号代表前面的字符可以不出现，也可以出现一次或者多次（0次、或1次、或多次）。
? 问号代表前面的字符最多只可以出现一次（0次、或1次）。

点击(此处)折叠或打开

普通字符
[ABC] 匹配 [...] 中的所有字符
[^ABC] 匹配 [...] 外的所有字符
[A-Z][a-z] 表示一个区间匹配所有大写/小写字母
. 匹配除换行符（\n、\r）之外的任何单个字符，相等于 [^\n\r]。
[\s\S] 匹配所有。\s 是匹配所有空白符，包括换行，\S 非空白符，不包括换行。
\w 匹配字母、数字、下划线。等价于 [A-Za-z0-9_]

点击(此处)折叠或打开

非打印字符
\cx 匹配由x指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 'c' 字符。
\f 匹配一个换页符。等价于 \x0c 和 \cL。
\n 匹配一个换行符。等价于 \x0a 和 \cJ。
\r 匹配一个回车符。等价于 \x0d 和 \cM。
\s 匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。注意 Unicode 正则表达式会匹配全角空格符。
\S 匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。
\t 匹配一个制表符。等价于 \x09 和 \cI。
\v 匹配一个垂直制表符。等价于 \x0b 和 \cK。

点击(此处)折叠或打开

特殊字符
$ 匹配输入字符串的结尾位置。如果设置了 RegExp 对象的 Multiline 属性，则 $ 也匹配 '\n' 或 '\r'。要匹配 $ 字符本身，请使用 \$。
( ) 标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符，请使用 $ 和 $。
* 匹配前面的子表达式零次或多次。要匹配 * 字符，请使用 \*。
+ 匹配前面的子表达式一次或多次。要匹配 + 字符，请使用 \+。
. 匹配除换行符 \n 之外的任何单字符。要匹配 . ，请使用 \. 。
[ 标记一个中括号表达式的开始。要匹配 [，请使用 \[。
? 匹配前面的子表达式零次或一次，或指明一个非贪婪限定符。要匹配 ? 字符，请使用 \?。
\ 将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。例如， 'n' 匹配字符 'n'。'\n' 匹配换行符。序列 '\\' 匹配 "\"，而 '\(' 则匹配 "("。
^ 匹配输入字符串的开始位置，除非在方括号表达式中使用，当该符号在方括号表达式中使用时，表示不接受该方括号表达式中的字符集合。要匹配 ^ 字符本身，请使用 \^。
{ 标记限定符表达式的开始。要匹配 {，请使用 \{。
| 指明两项之间的一个选择。要匹配 |，请使用 \|。

点击(此处)折叠或打开

限定符
* 匹配前面的子表达式零次或多次。例如，zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。
+ 匹配前面的子表达式一次或多次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+ 等价于 {1,}。
? 匹配前面的子表达式零次或一次。例如，"do(es)?" 可以匹配 "do" 、 "does" 中的 "does" 、 "doxy" 中的 "do" 。? 等价于 {0,1}。
{n} n 是一个非负整数。匹配确定的 n 次。例如，'o{2}' 不能匹配 "Bob" 中的 'o'，但是能匹配 "food" 中的两个 o。
{n,} n 是一个非负整数。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。
{n,m} m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。例如，"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。

点击(此处)折叠或打开

* 和 + 限定符都是贪婪的，因为它们会尽可能多的匹配文字，只有在它们的后面加上一个 ? 就可以实现非贪婪或最小匹配。例如

/<\w+?>/ 匹配 <h1>RUNOOB-菜鸟教程</h1> 得到 <h1>

点击(此处)折叠或打开

定位符

定位符使您能够将正则表达式固定到行首或行尾。它们还使您能够创建这样的正则表达式，这些正则表达式出现在一个单词内、在一个单词的开头或者一个单词的结尾。

^    匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性，^ 还会与 \n 或 \r 之后的位置匹配。

$    匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性，$ 还会与 \n 或 \r 之前的位置匹配。

\b    匹配一个单词边界，即字与空格间的位置。

\B    非单词边界匹配。

注意：不能将限定符与定位符一起使用。由于在紧靠换行或者单词边界的前面或后面不能有一个以上位置,
因此不允许诸如 ^* 之类的表达式。

若要匹配一行文本开始处的文本，请在正则表达式的开始使用 ^ 字符。不要将 ^ 的这种用法与中括号表达式内的用法混淆。

若要匹配一行文本的结束处的文本，请在正则表达式的结束处使用 $ 字符。

/\Bapt/ 匹配 Chapter 中的字符串 apt，但不匹配" aptitude" 中的字符串 apt

/ter\b/  匹配 "Chapter "中的字符串 "ter "

点击(此处)折叠或打开

选择

用圆括号 () 将所有选择项括起来，相邻的选择项之间用 | 分隔。

() 表示捕获分组，() 会把每个分组里的匹配的值保存起来，多个匹配值可以通过数字 n 来查看(n 是一个数字，表示第 n 个捕获组的内容)。

用圆括号会有一个副作用，使相关的匹配会被缓存，此时可用 ?: 放在第一个选项前来消除这种副作用

?= 正向预查，在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串

?!为负向预查，在任何开始不匹配该正则表达式模式的位置来匹配搜索字符串。

?=、?<=、?!、?

点击(此处)折叠或打开

反向引用

/\b([a-z]+) \1\b/ig

[a-z]+ 指定的，包括一个或多个字母

\1 指定第一个子匹配项

\b xxx \b 确保只检测整个单词

g 全局标记指定将该表达式应用到输入字符串中能够查找到的尽可能多的匹配。

i 标记指定不区分大小写。

点击(此处)折叠或打开

修饰符（标记）

标记用于指定额外的匹配策略。

标记不写在正则表达式里，标记位于表达式之外，格式如下：

/pattern/flags

i    ignore - 不区分大小写    将匹配设置为不区分大小写，搜索时不区分大小写: A 和 a 没有区别。

g    global - 全局匹配    查找所有的匹配项。否则会只找到第一次的匹配项

m    multi line - 多行匹配    使边界字符 ^ 和 $ 匹配每一行的开头和结尾，记住是多行，而不是整个字符串的开头和结尾。

s    特殊字符圆点 . 中包含换行符 \n    默认情况下的圆点 . 是匹配除换行符 \n 之外的任何字符，加上 s 修饰符之后, . 中包含换行符 \n。

点击(此处)折叠或打开

元字符

\

将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如，'n' 匹配字符 "n"。'\n' 匹配一个换行符。序列 '\\' 匹配 "\" 而 "\(" 则匹配 "("。

^

匹配输入字符串的开始位置。如果设置了 RegExp 对象的 Multiline 属性，^ 也匹配 '\n' 或 '\r' 之后的位置。

$

匹配输入字符串的结束位置。如果设置了RegExp 对象的 Multiline 属性，$ 也匹配 '\n' 或 '\r' 之前的位置。

*

匹配前面的子表达式零次或多次。例如，zo* 能匹配 "z" 以及 "zoo"。* 等价于{0,}。

+

匹配前面的子表达式一次或多次。例如，'zo+' 能匹配 "zo" 以及 "zoo"，但不能匹配 "z"。+ 等价于 {1,}。

?

匹配前面的子表达式零次或一次。例如，"do(es)?" 可以匹配 "do" 或 "does" 。? 等价于 {0,1}。

{n}

n 是一个非负整数。匹配确定的 n 次。例如，'o{2}' 不能匹配 "Bob" 中的 'o'，但是能匹配 "food" 中的两个 o。

{n,}

n 是一个非负整数。至少匹配n 次。例如，'o{2,}' 不能匹配 "Bob" 中的 'o'，但能匹配 "foooood" 中的所有 o。'o{1,}' 等价于 'o+'。'o{0,}' 则等价于 'o*'。

{n,m}

m 和 n 均为非负整数，其中n <= m。最少匹配 n 次且最多匹配 m 次。例如，"o{1,3}" 将匹配 "fooooood" 中的前三个 o。'o{0,1}' 等价于 'o?'。请注意在逗号和两个数之间不能有空格。

?

当该字符紧跟在任何一个其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面时，匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串，而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如，对于字符串 "oooo"，'o+?' 将匹配单个 "o"，而 'o+' 将匹配所有 'o'。

.

匹配除换行符（\n、\r）之外的任何单个字符。要匹配包括 '\n' 在内的任何字符，请使用像"(.|\n)"的模式。

(pattern)

匹配 pattern 并获取这一匹配。所获取的匹配可以从产生的 Matches 集合得到，在VBScript 中使用 SubMatches 集合，在JScript 中则使用 $0…$9 属性。要匹配圆括号字符，请使用 '$' 或 '$'。

(?:pattern)

匹配 pattern 但不获取匹配结果，也就是说这是一个非获取匹配，不进行存储供以后使用。这在使用 "或" 字符 (|) 来组合一个模式的各个部分是很有用。例如， 'industr(?:y|ies) 就是一个比 'industry|industries' 更简略的表达式。

(?=pattern)

正向肯定预查（look ahead positive assert），在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如，"Windows(?=95|98|NT|2000)"能匹配"Windows2000"中的"Windows"，但不能匹配"Windows3.1"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。

(?!pattern)

正向否定预查(negative assert)，在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配，也就是说，该匹配不需要获取供以后使用。例如"Windows(?!95|98|NT|2000)"能匹配"Windows3.1"中的"Windows"，但不能匹配"Windows2000"中的"Windows"。预查不消耗字符，也就是说，在一个匹配发生后，在最后一次匹配之后立即开始下一次匹配的搜索，而不是从包含预查的字符之后开始。

(?<=pattern)    反向(look behind)肯定预查，与正向肯定预查类似，只是方向相反。例如，"(?<=95|98|NT|2000)Windows"能匹配"2000Windows"中的"Windows"，但不能匹配"3.1Windows"中的"Windows"。

(?

x|y

匹配 x 或 y。例如，'z|food' 能匹配 "z" 或 "food"。'(z|f)ood' 则匹配 "zood" 或 "food"。

[xyz]

字符集合。匹配所包含的任意一个字符。例如， '[abc]' 可以匹配 "plain" 中的 'a'。

[^xyz]

负值字符集合。匹配未包含的任意字符。例如， '[^abc]' 可以匹配 "plain" 中的'p'、'l'、'i'、'n'。

[a-z]

字符范围。匹配指定范围内的任意字符。例如，'[a-z]' 可以匹配 'a' 到 'z' 范围内的任意小写字母字符。

[^a-z]

负值字符范围。匹配任何不在指定范围内的任意字符。例如，'[^a-z]' 可以匹配任何不在 'a' 到 'z' 范围内的任意字符。

\b

匹配一个单词边界，也就是指单词和空格间的位置。例如， 'er\b' 可以匹配"never" 中的 'er'，但不能匹配 "verb" 中的 'er'。

\B

匹配非单词边界。'er\B' 能匹配 "verb" 中的 'er'，但不能匹配 "never" 中的 'er'。

\cx

匹配由 x 指明的控制字符。例如， \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则，将 c 视为一个原义的 'c' 字符。

\d

匹配一个数字字符。等价于 [0-9]。

\D

匹配一个非数字字符。等价于 [^0-9]。

\f

匹配一个换页符。等价于 \x0c 和 \cL。

\n

匹配一个换行符。等价于 \x0a 和 \cJ。

\r

匹配一个回车符。等价于 \x0d 和 \cM。

\s

匹配任何空白字符，包括空格、制表符、换页符等等。等价于 [ \f\n\r\t\v]。

\S

匹配任何非空白字符。等价于 [^ \f\n\r\t\v]。

\t

匹配一个制表符。等价于 \x09 和 \cI。

\v

匹配一个垂直制表符。等价于 \x0b 和 \cK。

\w

匹配字母、数字、下划线。等价于'[A-Za-z0-9_]'。

\W

匹配非字母、数字、下划线。等价于 '[^A-Za-z0-9_]'。

\xn

匹配 n，其中 n 为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如，'\x41' 匹配 "A"。'\x041' 则等价于 '\x04' & "1"。正则表达式中可以使用 ASCII 编码。

\num

匹配 num，其中 num 是一个正整数。对所获取的匹配的引用。例如，'(.)\1

点击(此处)折叠或打开

运算符优先级

正则表达式从左到右进行计算，并遵循优先级顺序

相同优先级的从左到右进行运算，不同优先级的运算先高后低

\    转义符

(), (?:), (?=), []    圆括号和方括号

*, +, ?, {n}, {n,}, {n,m}    限定符

^, $, \任何元字符、任何字符    定位点和序列（即：位置和顺序）

|    替换，"或"操作

字符具有高于替换运算符的优先级，使得"m|food"匹配"m"或"food"。若要匹配"mood"或"food"，请使用括号创建子表达式，从而产生"(m|f)ood"。

点击(此处)折叠或打开

基本模式匹配

^once 只匹配那些以once开头的字符串

^\t 匹配那些以制表符开头的字符串

bucket$ 只匹配那些以bucket结尾的字符串

^bucket$ 只匹配字符串"bucket"

once 与任何包含该模式的字符串匹配

字符簇

[AaEeIiOoUu]

[a-z] //匹配所有的小写字母

[A-Z] //匹配所有的大写字母

[a-zA-Z] //匹配所有的字母

[0-9] //匹配所有的数字

[0-9\.\-] //匹配所有的数字，句号和减号

[ \f\r\t\n] //匹配所有的白字符

[^a-z] //除了小写字母以外的所有字符

[^\\\/\^] //除了(\)(/)(^)之外的所有字符

[^\"\'] //除了双引号(")和单引号(

点击(此处)折叠或打开

基本模式匹配

^once 只匹配那些以once开头的字符串

^\t 匹配那些以制表符开头的字符串

bucket$ 只匹配那些以bucket结尾的字符串

^bucket$ 只匹配字符串"bucket"

once 与任何包含该模式的字符串匹配

字符簇

[AaEeIiOoUu]

[a-z] //匹配所有的小写字母

[A-Z] //匹配所有的大写字母

[a-zA-Z] //匹配所有的字母

[0-9] //匹配所有的数字

[0-9\.\-] //匹配所有的数字，句号和减号

[ \f\r\t\n] //匹配所有的白字符

[^a-z] //除了小写字母以外的所有字符

[^\\\/\^] //除了(\)(/)(^)之外的所有字符

[^\"\'] //除了双引号(")和单引号(

点击(此处)折叠或打开

示例

/\b([a-z]+) \1\b/gi    一个单词连续出现的位置。

/(\w+):\/\/([^/:]+)(:\d*)?([^# ]*)/    将一个URL解析为协议、域、端口及相对路径。

/^(?:Chapter|Section) [1-9][0-9]{0,1}$/    定位章节的位置。

/[-a-z]/    a至z共26个字母再加一个-号。

/ter\b/    可匹配chapter，而不能匹配terminal。

/\Bapt/    可匹配chapter，而不能匹配aptitude。

/Windows(?=95 |98 |NT )/    可匹配Windows95或Windows98或WindowsNT，当找到一个匹配后，从Windows后面开始进行下一次的检索匹配。

/^\s*$/    匹配空行。

/\d{2}-\d{5}/    验证由两位数字、一个连字符再加 5 位数字组成的 ID 号。

/<\s*(\S+)(\s[^>]*)?>[\s\S]*<\s*\/\1\s*>/    匹配 HTML 标记。

点击(此处)折叠或打开

示例

/\b([a-z]+) \1\b/gi    一个单词连续出现的位置。

/(\w+):\/\/([^/:]+)(:\d*)?([^# ]*)/    将一个URL解析为协议、域、端口及相对路径。

/^(?:Chapter|Section) [1-9][0-9]{0,1}$/    定位章节的位置。

/[-a-z]/    a至z共26个字母再加一个-号。

/ter\b/    可匹配chapter，而不能匹配terminal。

/\Bapt/    可匹配chapter，而不能匹配aptitude。

/Windows(?=95 |98 |NT )/    可匹配Windows95或Windows98或WindowsNT，当找到一个匹配后，从Windows后面开始进行下一次的检索匹配。

/^\s*$/    匹配空行。

/\d{2}-\d{5}/    验证由两位数字、一个连字符再加 5 位数字组成的 ID 号。

/<\s*(\S+)(\s[^>]*)?>[\s\S]*<\s*\/\1\s*>/    匹配 HTML 标记。

阅读(903) | 评论(0) | 转发(0) |

上一篇：影响项目成功与否的因素思考

下一篇：声网 agora 的接入实战和验证

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6