Chinaunix首页 | 论坛 | 博客
  • 博客访问: 216357
  • 博文数量: 87
  • 博客积分: 192
  • 博客等级: 入伍新兵
  • 技术积分: 455
  • 用 户 组: 普通用户
  • 注册时间: 2011-04-14 07:44
文章分类

全部博文(87)

文章存档

2013年(1)

2012年(86)

分类:

2012-04-14 15:40:54

原文地址:sed之避开贪婪匹配 作者:zooyo

  1. cat file
  2. <span class=a><span class=b>AAA<a href="">link</a></span>5678</span>
  3. <span class=a><span class=b>BBB<a href="">link</a></span>5678</span>
  4. <span class=a><span class=b>CCC<a href="">link</a></span>5678</span>

提取第一个之间的字符串

 

  1. sed -r 's/[^>]*>[^>]*b>([^>]*>[^>]*>).*/\1/' file
  2. AAA<a href="">link</a>
  3. BBB<a href="">link</a>
  4. CCC<a href="">link</a>

[解析]

  文本中有2个,这是在sed中最头疼的问题,因为它是贪婪匹配,如果有多个pattern的话,它肯定是匹配到最后一个,如果规避这个问题,只有把文本用正则逐个标记出来。

阅读(850) | 评论(0) | 转发(0) |
0

上一篇:sed之N与P

下一篇:sed之n与N运用实例

给主人留下些什么吧!~~