Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1140952
  • 博文数量: 141
  • 博客积分: 3161
  • 博客等级: 中校
  • 技术积分: 3011
  • 用 户 组: 普通用户
  • 注册时间: 2011-09-27 14:53
文章存档

2012年(28)

2011年(113)

分类: 嵌入式

2011-09-29 10:26:33

     前言:很感谢大家对正则表达式文章的支持,这篇文章是这个系列的最后一节了,但是正如之前所说的,这里将的仅仅只是怎么用.NET的正则表达式类,但是,对正则表达式的引擎的内部机制没有提及,如果大家需要,我会继续写下有关内部机制的问题.

 

     今天的内容如下:

     1. Match对象的使用

     2. Group对象的使用

     3.便捷方法

     4. 正则表达式的缓存

        

     今天的内容比较好懂.

     1. Match类的使用

 

     一般有三种方法可以创建Match对象:第一:Regex的Match方法,第二,静态函数Regex.Match方法,第三,Match对象自己的NextMatch方法.Match对象封装了某个正则表达式对象的单次应用的所有的相关信息.

    下面介绍相关的属性和方法:


    假设:myMatch对象是我们已经创建好的一个Match对象.

    myMatch.Success属性,返回一个bool的值,表示一个匹配是否成功.

    myMatch.Value属性和myMatch.ToString方法,返回实际匹配的文本,注意:Match是单次匹配

    myMatch.Length属性,匹配文本的长度

    myMatch.Index属性,返回是一个整数,显示匹配文本再目标中的其实位置,匹配是从字符串的左边向右匹配的,编号从0开始.

 

    注意:这个数字表示从目标字符串的最左边到匹配文本的左边的长度,如匹配"abc",而我们的串是" asdffabc",把么Index就是5.即使再创建Match对象时设置RegexOptions.RigthToLeft,返回值依然不变.

    myMatch.Groups属性,返回一个GroupCollection对象,其中封装了多个Match的对象,GroupCollection是一个普通的集合类,有Item和Count属性,常用的是按照索引来访问,如之前的Group[2].等等.,如果正则表达式有命名的捕获括号匹配,还可以这样:Group["yourName"].Value来访问匹配的文本值.

      

    注意:Group[0]表示整个正则表达式匹配的所有文本,我们之前说过的.所以myMatch.Groups[0].Value就和myMatch.Value是相等的.          

     

    myMatch.NextMatch方法,很好理解,大家可以和一些集合的迭代,如ArrayList的Next()方法类比,寻找下一个匹配,返回新的Match对象.

          

     2. Group对象

 

     其实这个对象和前面的Match对象的方法和属性很多一样的,可以这么说,Group是Match的一个特例(他们只是不是继承关系,我不清楚,,我没有查看MSDN),但是从理解上至少是这样的,因为Match表示一个匹配,不管是什么的样的匹配,如:捕获匹配,还是一般的匹配,只要是一个匹配,我们就可以用Match来封装相关的信息,而Group只是一个捕获性括号的匹配.

    下面介绍方法和属性:

    同样假设有一个Group对象 :myGroup.

    myGroup.Success属性:返回bool,说明一个分组是否参与了匹配,,不是所有的分组都参与匹配的.如,正则表达式"(abc)(def)"来匹配"abccc",那么只有"(abc)"那个分组匹配成功了.

    myGroup.Value属性和myGroup.ToString方法:返回匹配的文本的副本,如上面的例子那个匹配分组的例子就返回"abc";

    myGroup.Length属性,返回整数,表示匹配的分组匹配的文本的长度,如上面就例子返回"3";

    myGroup.Index属性,返回分组匹配的文本的开始位置.如上面的例子就返回0.

 

     3.便捷函数.

     很多的时候,我们不用new一个Regex对象,因为Regex这个类有很多的方法来直接使用.

     
  1.       Regex.IsMatch()调用这个静态的方法,来表示匹配是否成功

  2.       Regex.Matches()

  3.       Regex.Replace()

  4.       Regex.Split()

    以上方法我不赘述了,和之前的一样.

 

     4 正则表达式的缓存

 

    为简单的正则表达式创建Regex对象不方便,而且也不浪费资源,所有我们可以用Regex类的一些静态方法(见上).但是这些静态的方法也是有缺陷的,因为每次调用的时候都会创建一个临时的Regex的对象,而且用一次就丢弃了.特别是再循环中时,开销更加大.所以为了避免重复的工作,可以缓存静态方法创建的临时变量.

  

    .NET Framework默认可以缓存15个正则表达式,如果再循环中使用的正则表达式超过了15个,那么第16个就取代第一个,如此类推.

 

     我们只要这样,这样:

     Regex.CacheSize=123;就可以将默认的缓存调整为你需要的.

          

    注意:一般系统缓存的是你最近用过的123个缓存,也就是说,.net已经有了内部机制来缓存,我们要知道这一点,而且只要设置CacheSize就可以了.

          

    好了,各位,就写到这里了,如果需要,以后的文章要谈谈正则表达式的内部机制.但是,是看看大家的需要啦!谢谢一直关注啊!

阅读(1308) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~