Chinaunix首页 | 论坛 | 博客
  • 博客访问: 99549
  • 博文数量: 23
  • 博客积分: 1546
  • 博客等级: 上尉
  • 技术积分: 170
  • 用 户 组: 普通用户
  • 注册时间: 2007-11-18 19:47
文章分类

全部博文(23)

文章存档

2012年(1)

2011年(6)

2010年(3)

2009年(13)

我的朋友

分类:

2009-07-14 16:15:17

   最近一直在做审计邮件、帖子的工作,所以得首先学会正则。虽说网上对正则表达式解释的已经够详尽的了, 但是把网上的试子照搬到php中,还是有一些惹人厌的问题:
譬如在中有个这样的式子(?<=<(\w+)>).*(?=<\/\1>)用于匹配不包含属性的简单HTML标签内里的内容,按道理来说直接在preg_match中运用应该没什么问题,可实际呢:

$str = "aaaaaabbbbbbcccccccddddddfffff";
preg_match("/(?<=<(\w+)>).*(?=<\/\1>)/s", $str, $matches);
var_dump($matches);

结果报错:
Warning: preg_match(): Compilation failed: lookbehind assertion is not fixed length at offset 11...
于是把\w+直接写成font:

preg_match("/(?<=<(font)>).*(?=<\/\1>)/s", $str, $matches);

YYD,结果尽然为空,这个问题困扰了我好久,瞎猫碰死耗子,将\1无名组换成有名组尽然成了:

preg_match("/(?<=<(?Pfont)>).*(?=<\/(?P=tag)>)/s", $str, $matches);

终于成功了,但是那些失败的例子都在正则的测试工具里试过了,不知道为什么...

下面举几个经典正则的小例子:
  1. \b((?!abc)\w)+\b , 匹配不包含连续字符串abc的单词,对于字符串"asdf abcaa abcbb abab", 它会取出asdf 和 abab。
  2. ((?!<\/?font>).|(?R))*<\/font> 递归匹配,给出上面的字符串aaaaaabbbbbbcccccccddddddfffff,其会从中引出两组:0组,aaaaaabbbbbbcccccccdddddd 1组,dddddd
其它的以后再写。

给出几其他人的好文章:
C#基础回顾:正则表达式
正则表达式30分钟入门教程
正则表达式高级技巧背后的关键概念
表达式的递归匹配
递归深度匹配 正则表达式


阅读(1250) | 评论(0) | 转发(0) |
0

上一篇:存储类

下一篇:奇特的声明和const修饰符

给主人留下些什么吧!~~