Chinaunix首页 | 论坛 | 博客
  • 博客访问: 671454
  • 博文数量: 845
  • 博客积分: 5000
  • 博客等级: 大校
  • 技术积分: 5015
  • 用 户 组: 普通用户
  • 注册时间: 2008-10-15 16:22
文章分类

全部博文(845)

文章存档

2011年(1)

2008年(844)

我的朋友

分类:

2008-10-15 16:25:11

  长期以来,Perl以其对常规表达式的固有支持,一直是非常流行的文本处理工具。在这篇入门性文章中,我们将带领你简单了解如何在你自己的程序中使用常规表达式,实现更加强大的文本搜索和替代功能。

  我们首先了解最简单的常规表达式:匹配。如果在字符串中找到相匹配的模式,匹配操作就返回真值。因此下面的表达式:

  $string =~ m/text/

  只有在变量“$string”中的字符串包含子字符串“text”时才返回真值。这是最基本的常规表达式,它对每个字符进行逐字匹配。当然,这只是对常规表达式作用的一个尝试。以需要查找以“ext”结尾的四个字母的单词为例。为达到这个目的,我们使用一个特殊的字符“.”,常规表达式中的句号告诉 Perl匹配其中的任何单独的字符。因此下面这个表达式:

  $string =~ m/.ext/

  将与单词“text”和“next”匹配。

  不过,这个表达式并非完美,因为它与包含“ext”的更长单词的一部分相匹配,如“dextrous”和“flextime”。我们可以使用锚字符来限制匹配的位置。“^”字符匹配字符串的开头,因此:

  $string =~ m/^.ext/

  与“dextrous”匹配,但不与“context”匹配。

  同样,“$”字符匹配字符串的结尾:

  $string =~ m/.ext$/

  与“context”匹配,但不与“dextrous”匹配。

  如果你只希望匹配以“ext”结尾的四个字母的字符串,那么你可以组合使用上面的两个表达式,像这样:

  $string =~ m/^.ext$/

  现在,如果你需要匹配一组给定的字符,而不是句号位置的任何字符,那该怎么办呢?常规表达式通过使用方括号提供一个方法。以下面的表达式为例:

  $string =~ m/^[tT]ext$/

  这个表达式只与单词“text”和“Text”匹配。一对方括号将转换其中的任何单个字符。这个功能相当强大,例如:

  $string =~ m/[aeiouAEIOU]/

  如果$string变量中含有元音,则上面的例子返回真值。

  如果括号中的第一个字符是“^”,这时它就不是一个锚字符,而是执行“非”操作,匹配不在括号内的任意字符,因此如果$string变量中只包含辅音或标点符号,可以对上面的例子进行调整,使它返回真值:

  $string =~ m/[^aeiouAEIOU]/

  方括号符号还可以指定字符的范围,让你不必列举一整串连续的数字或字母,例如,下面的例子匹配任何小写字母:

  $string =~ m/[a-z]/

[1]  

【责编:Youping】

--------------------next---------------------

阅读(366) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~