符号 原子性 含义
\0 是 匹配空字符(ASCII NUL)。
\NNN 是 匹配给出八进制的字符,最大值为\377。
\n 是 匹配前面第n个捕获字串(十进制)。
\a 是 匹配警钟字符(BEL)。
\A 否 如果在字串的开头为真。
\b 是 匹配边界时为真。
\b 否 在字边界为真。
\B 否 匹配非边界时为真。
\cX 是 匹配控制字符 Control-x(\cZ,\c[,等)。
\C 是 匹配一个字节(C字符),甚至在utf8中也如此(危险)。
\d 是 匹配任何数字字符。
\D 是 匹配任何非数字字符。
\e 是 匹配逃逸字符(ASCII ESC,不是反斜杠)。
\E — 结束大小写(\L,\U)或者掩码(\Q)转换
\f 是 匹配进页字符(FF)。
\G 否 如果在前一个m//g的匹配结尾位置时为真。
\l — 只把下一个字符变成小写。
\L — 把\E以前的字母都变成小写。
\n 是 匹配换行符字符(通常是NL,但是在Mac上是CR)。
\N{NAME} 是 匹配命名字符(\N{greek:Sigma})。
\p{PROP} 是 匹配任何有命名属性的字符。
\P{PROP} 是 匹配任何没有命名属性的字符。
\Q — 引起(消元)直到\E前面的字符。
\r 是 匹配返回字符(通常是CR,但是在Mac上是NL)。
\s 是 匹配任何空白字符。
\S 是 匹配任何非空白字符。
\t 是 匹配水平制表符(HT)。
\u — 只把下一个字符变成标题首字符
\U — 大写(不是标题首字符)\E 以前的字符。
\w 是 匹配任何“字”字符(字母数字加"_" )。
\W 是 匹配任何“非字”字符。
\x{abcd} 是 匹配在十六进制中给出的字符。
\X 是 匹配Unicode里的”组合字符序列“字串。
\z 否 只有在字串结尾时为真。
\Z 否 在字串结尾或者在可选的换行符之前为真。
\` Matches only at the start of pattern space. This is different from ^ in multi-line mode.
\' Matches only at the end of pattern space. This is different from $ in multi-line mode.
PS:红色标注是可以在GNU sed里直接使用的扩展功能。
阅读(2503) | 评论(1) | 转发(2) |