全部博文(245)
分类:
2008-05-17 08:54:48
正则表达式(Regular Expression)
是一种描述文本(或字符串)模式的工具。正则表达式常用于查找文本的场合。想想一下我们日常生活中的例子,假如你想从电话本里找一个联系人的电话,而你又
想不起联系人名字的准确拼法,你可以把电话本从头到尾翻一遍,如果电话本里联系人少的话也许并不是什么麻烦事,但想象一下如果这是记录着公司所有员工的电
话本,你面临的工作便复杂得多了,有可能是从几百甚至几千条记录中寻找你想要的那条电话记录!而利用正则表达式则为解决这一问题提供了一种简便有效的方
法。
正则表达式是一种描述具有某些共同特征的文本的文本,在不同的环境里有不同的格式,但其大致格式是相似的。本文将介绍Unix系统下的正则表达式。
其实,也许在你不清楚正则表达式是什么的时候你已经开始使用它了。想想Linux里一个最常用的命令:
ls *.tar
在这个命令里,*.tar 便是一个正则表达式,它是一个描述了这样的字符串的字符串:以任意数量的任意字符开头(*),后面紧接一个句点(.),然后再跟一个tar(这是在Unix Shell里表示的意思,在其他场合有不同的意思,后文将介绍)。星号(*)我们在DOS里常称之为“通配符(wildcard)”,而在正则表达式里我们称之为“元字符(metacharacter)”。下一章节我们将介绍正则表达式里常用的元字符。