（转）【re模块】Py正则表达式中的【零宽断言】-chinaboywg-ChinaUnix博客

chinaboy小宝chinaboy007.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

chinaboywg

博客访问： 2923237
博文数量： 348
博客积分： 2907
博客等级：中校
技术积分： 2272
用户组：普通用户
注册时间： 2010-03-12 09:16

个人简介

专注 K8S研究

文章分类

全部博文（348）

elk（2）
docker（5）
error（0）
zabbix（21）
haproxy（2）
linux（11）
redis（2）
lvs（9）
squid（8）
nagios（4）
puppet（6）
html（1）
nginx（45）
apache（3）
mysql（65）
php（0）
python（114）

pycharm（1）

pip（1）

requests（1）

requests（0）

urllib（0）

logging（1）

flask（0）

lib（0）

pyqt4（14）

django（7）

beautifulsoup（11）

scrapy（3）

string（6）

pexpect（4）
shell（19）
linux（25）
other（4）
未分配的博文（2）

文章存档

2019年（22）

2018年（57）

2016年（2）

2015年（27）

2014年（33）

2013年（190）

2011年（3）

2010年（14）

我的朋友

相关博文

（转）【re模块】Py正则表达式中的【零宽断言】

分类： Python/Ruby

2013-06-29 23:03:00

原文地址：（转）【re模块】Py正则表达式中的【零宽断言】作者：g_programming

Py正则表达式中的【零宽断言】

转自：http://blog.csdn.net/magictong/article/details/5332423

（一）零宽断言

说明：本文的例子使用python描述
      首先说明一下什么是零宽断言，所谓零宽断言就是并不去真正的匹配字符串文本，而仅仅是匹配对应的位置。
      正则表达式中有很多这样的断言，常见的如匹配字符串或者行的起始位置 ^ 和 /A，匹配字符串或者行的末尾 $ 和 /Z，单词边界/B等等。这些简单的就不说了，今天主要说一下界定的使用方法（有些资料叫环式结构，名字而已，不重要）。界定也是一种零宽断言，界定主要有四类：
      1、前向界定（肯定顺序环视）(?=exp)
      表示右边要匹配exp表达式

1. strTest = "aaa111aaa , bbb222&, 333ccc"

2. strRe = r"\d+(?=[a-z]+)"

3. reObj = re.compile(strRe)

4. print reObj.findall(strTest)

输出：（正则的意思是找出连续的数字并且最后一个数字跟着至少一个a-z里面的字符序列）

1. ['111', '333']

2、前向否定界定（否定顺序环视）(?!exp)
表示右边不匹配exp表达式

1. strTest = "aaa111aaa , bbb222&, 333ccc"

2. strRe = r"\d+(?![a-z]+)"

3. reObj = re.compile(strRe)

4. print reObj.findall(strTest)

输出：（正则的意思是找出连续的数字，并且最后一个数字后面不能跟任何一个a-z里面的字符序列）

1. ['11', '222', '33']

3、反向界定（肯定逆序环视）(?<=exp) 文本必须定长
表示左边要匹配exp表达式

1. strTest = "aaa111aaa , bbb222&, 333ccc"

2. strRe = r"(?<=[a-z])\d+"

3. reObj = re.compile(strRe)

4. print reObj.findall(strTest)

输出：（正则的意思是找出连续的数字，并且第一个数字的前面要是a-z中的一个字符）

1. ['111', '222']

4、反向否定界定（否定逆序环视）(? 文本必须定长
表示左边不要匹配exp表达式

1. strTest = "aaa111aaa , bbb222&, 333ccc"

2. strRe = r"(?

3. reObj = re.compile(strRe)

4. print reObj.findall(strTest)

输出：（正则的意思是找出连续的数字，并且第一个数字的前面不能是a-z中的一个字符）

1. ['11', '22', '333']

这里要注意的一个问题是：在python和Perl中两个反向界定的表达式exp只允许使用定长文本，譬如最后第四个例子，如果正则表达式写成：strRe = r"(?，py解释器会报错：error: look-behind requires fixed-width pattern。

（二）命名组和无捕获组

python里面还有一种命名组和无捕获组
命名组比较牛×，也是python的扩展，能把捕获组向使用字典一样的使用：

1. s= 'Tom:9527 , Sharry:0003'

2. m=re.match( r'(?P\w+):(?P\d+)' , s)

3. print m.group()

4. print m.group(0)

5. print m.group(1)

6. print m.group(2)

7. print m.groups()

8. print m.group("name")

9. print m.group("num")

输出：

1. Tom:9527

2. Tom:9527

3. Tom

4. 9527

5. ('Tom', '9527')

6. Tom

7. 9527

无捕获组的使用也是类似，语法：(?:exp)只是无捕获组匹配exp，但不捕获匹配的文本，也不给这个组分配组号。

用这种方法还能写正则表达式的注释，呵呵，语法：(?#exp)，exp是注释，不对整个正则表达式产生任何副作用，仅供阅读。

使用python写的一个洗牌程序，简洁吧，嘿嘿。

1. #! /usr/bin/env python

2. # -*- coding: utf-8 -*-

4. from random import shuffle

5. from random import choice

7. values = range(2, 11) + 'Jack Queen King A'.split()

8. suits = 'diamonds clubs hearts spades'.split()

10. deck = ['%s_%s' % (v, s) for v in values for s in suits]

11.

12. # 打乱顺序

13. shuffle(deck)

14.

15. while deck:

16. # 随机取一个

17. randomCard = choice(deck)

18. print randomCard

19. deck.remove(randomCard)

阅读(1731) | 评论(0) | 转发(0) |

上一篇：（转）【ConfigParser模块】Python处理配置文件

下一篇：（转）【os模块】Python生成目录树

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6