Chinaunix首页 | 论坛 | 博客
  • 博客访问: 170473
  • 博文数量: 48
  • 博客积分: 365
  • 博客等级: 一等列兵
  • 技术积分: 285
  • 用 户 组: 普通用户
  • 注册时间: 2011-10-11 17:59
文章分类

全部博文(48)

文章存档

2017年(21)

2016年(8)

2013年(2)

2012年(7)

2011年(10)

我的朋友

分类: Java

2017-02-18 19:40:54



JAVA正则表达式:Pattern类与Matcher类详解

以下我们就分别来看看这两个类:

一、捕获组的概念

捕获组可以通过从左到右计算其开括号来编号,编号是从1 开始的。例如,在表达式 ((A)(B(C)))中,存在四个这样的组:

1        ((A)(B(C)))
2        (A)
3        (B(C))
4        (C)

组零始终代表整个表达式。 以 (?) 开头的组是纯的非捕获 组,它不捕获文本,也不针对组合计进行计数。

与组关联的捕获输入始终是与组最近匹配的子序列。如果由于量化的缘故再次计算了组,则在第二次计算失败时将保留其以前捕获的值(如果有的话)例如,将字符串"aba" 与表达式(a(b)?)+ 相匹配,会将第二组设置为 "b"。在每个匹配的开头,所有捕获的输入都会被丢弃。

二、详解Pattern类和Matcher类

java正则表达式通过java.util.regex包下的Pattern类与Matcher类实现(建议在阅读本文时,打开java API文档,当介绍到哪个方法时,查看java API中的方法说明,效果会更佳).
Pattern类用于创建一个正则表达式,也可以说创建一个匹配模式,它的构造方法是私有的,不可以直接创建,但可以通过Pattern**plie(String regex)简单工厂方法创建一个正则表达式,
Java代码示例:

Pattern p=Pattern**pile("\\w+");
p.pattern();//返回 \w+

pattern() 返回正则表达式的字符串形式,其实就是返回Pattern**plile(String regex)的regex参数

1.Pattern.split(CharSequence input)

Pattern有一个split(CharSequence input)方法,用于分隔字符串,并返回一个String[],我猜String.split(String regex)就是通过Pattern.split(CharSequence input)来实现的.
Java代码示例:

Pattern p=Pattern**pile("\\d+");
String[] str=p.split("我的QQ是:456456我的电话是:0532214我的邮箱是:aaa@aaa**");

结果:str[0]="我的QQ是:" str[1]="我的电话是:" str[2]="我的邮箱是:aaa@aaa**"

2.Pattern.matcher(String regex,CharSequence input)是一个静态方法,用于快速匹配字符串,该方法适合用于只匹配一次,且匹配全部字符串.

Java代码示例:

Pattern.matches("\\d+","2223");//返回true
Pattern.matches("\\d+","2223aa");//返回false,需要匹配到所有字符串才能返回true,这里aa不能匹配到
Pattern.matches("\\d+","22bb23");//返回false,需要匹配到所有字符串才能返回true,这里bb不能匹配到

3.Pattern.matcher(CharSequence input)

说了这么多,终于轮到Matcher类登场了,Pattern.matcher(CharSequence input)返回一个Matcher对象.
Matcher类的构造方法也是私有的,不能随意创建,只能通过Pattern.matcher(CharSequence input)方法得到该类的实例.
Pattern类只能做一些简单的匹配操作,要想得到更强更便捷的正则匹配操作,那就需要将Pattern与Matcher一起合作.Matcher类提供了对正则表达式的分组支持,以及对正则表达式的多次匹配支持.
Java代码示例:

Pattern p=Pattern**pile("\\d+");
Matcher m=p.matcher("22bb23");
m.pattern();//返回p 也就是返回该Matcher对象是由哪个Pattern对象的创建的

4.Matcher.matches()/ Matcher.lookingAt()/ Matcher.find()

Matcher类提供三个匹配操作方法,三个方法均返回boolean类型,当匹配到时返回true,没匹配到则返回false
matches()对整个字符串进行匹配,只有整个字符串都匹配了才返回true
Java代码示例:

Pattern p=Pattern**pile("\\d+");
Matcher m=p.matcher("22bb23");
m.matches();//返回false,因为bb不能被\d+匹配,导致整个字符串匹配未成功.
Matcher m2=p.matcher("2223");
m2.matches();//返回true,因为\d+匹配到了整个字符串

我们现在回头看一下Pattern.matcher(String regex,CharSequence input),它与下面这段代码等价
Pattern**pile(regex).matcher(input).matches()

lookingAt()对前面的字符串进行匹配,只有匹配到的字符串在最前面才返回true
Java代码示例:

Pattern p=Pattern**pile("\\d+");
Matcher m=p.matcher("22bb23");
m.lookingAt();//返回true,因为\d+匹配到了前面的22
Matcher m2=p.matcher("aa2223");
m2.lookingAt();//返回false,因为\d+不能匹配前面的aa

find()对字符串进行匹配,匹配到的字符串可以在任何位置.
Java代码示例:

Pattern p=Pattern**pile("\\d+");
Matcher m=p.matcher("22bb23");
m.find();//返回true
Matcher m2=p.matcher("aa2223");
m2.find();//返回true
Matcher m3=p.matcher("aa2223bb");
m3.find();//返回true
Matcher m4=p.matcher("aabb");
m4.find();//返回false

5.Mathcer.start()/ Matcher.end()/ Matcher.group()

当使用matches(),lookingAt(),find()执行匹配操作后,就可以利用以上三个方法得到更详细的信息.
start()返回匹配到的子字符串在字符串中的索引位置.
end()返回匹配到的子字符串的最后一个字符在字符串中的索引位置.
group()返回匹配到的子字符串
Java代码示例:

Pattern p=Pattern**pile("\\d+");
Matcher m=p.matcher("aaa2223bb");
m.find();//匹配2223
m.start();//返回3
m.end();//返回7,返回的是2223后的索引号
m.group();//返回2223 

Mathcer m2=m.matcher("2223bb");
m.lookingAt();   //匹配2223
m.start();   //返回0,由于lookingAt()只能匹配前面的字符串,所以当使用lookingAt()匹配时,start()方法总是返回0
m.end();   //返回4
m.group();   //返回2223 

Matcher m3=m.matcher("2223bb");
m.matches();   //匹配整个字符串
m.start();   //返回0,原因相信大家也清楚了
m.end();   //返回6,原因相信大家也清楚了,因为matches()需要匹配所有字符串
m.group();   //返回2223bb

说了这么多,相信大家都明白了以上几个方法的使用,该说说正则表达式的分组在java中是怎么使用的.
start(),end(),group()均有一个重载方法它们是start(int i),end(int i),group(int i)专用于分组操作,Mathcer类还有一个groupCount()用于返回有多少组.
Java代码示例:

Pattern p=Pattern**pile("([a-z]+)(\\d+)");
Matcher m=p.matcher("aaa2223bb");
m.find();   //匹配aaa2223
m.groupCount();   //返回2,因为有2组
m.start(1);   //返回0 返回第一组匹配到的子字符串在字符串中的索引号
m.start(2);   //返回3
m.end(1);   //返回3 返回第一组匹配到的子字符串的最后一个字符在字符串中的索引位置.
m.end(2);   //返回7
m.group(1);   //返回aaa,返回第一组匹配到的子字符串
m.group(2);   //返回2223,返回第二组匹配到的子字符串

现在我们使用一下稍微高级点的正则匹配操作,例如有一段文本,里面有很多数字,而且这些数字是分开的,我们现在要将文本中所有数字都取出来,利用java的正则操作是那么的简单.
Java代码示例:

Pattern p=Pattern**pile("\\d+");
Matcher m=p.matcher("我的QQ是:456456 我的电话是:0532214 我的邮箱是:aaa123@aaa**");
while(m.find()) {
     System.out.println(m.group());
}

输出:
456456
0532214
123

如将以上while()循环替换成

while(m.find()) {
     System.out.println(m.group());
     System.out.print("start:"+m.start());
     System.out.println(" end:"+m.end());
}

则输出:
456456
start:6 end:12
0532214
start:19 end:26
123
start:36 end:39

现在大家应该知道,每次执行匹配操作后start(),end(),group()三个方法的值都会改变,改变成匹配到的子字符串的信息,以及它们的重载方法,也会改变成相应的信息.
注意:只有当匹配操作成功,才可以使用start(),end(),group()三个方法,否则会抛出java.lang.IllegalStateException,也就是当matches(),lookingAt(),find()其中任意一个方法返回true时,才可以使用.

标签: Java, 正则表达式, pattern, Matcher
分类:
时间: 2015-03-05

相关文章

  1. java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包.它包括两个类:Pattern和Matcher Pattern 一个Pattern是一个正则表达式经编译后的表现模式. Match ...
  2. 这篇文章主要介绍了Python中用Descriptor实现类级属性(Property)详解,本文先是讲解了decorator是什么,然后给出了通过Descriptor来做一个类级的Property实例,需要的朋友可以参考 ...
  3. 这篇文章主要介绍了Java I/O技术之文件操作详解,需要的朋友可以参考下 在java程序设计中,I/O操作是通过java.io包中的类和接口来实现的,因此,我们第一步要做的就是import这个包. java.io提供了 ...
  4. 这篇文章主要介绍了Java中堆和栈的区别详解,所有的Java程序都运行在JVM虚拟机内部,我们这里介绍的自然是JVM(虚拟)内存中的堆和栈,需要的朋友可以参考下 当一个人开始学习Java或者其他编程语言的时候,会接触到堆 ...
  5. java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 1.简介: java.util.regex是一个用正则表达式所订制的模式来对字符串进行匹配工作的类库包. 它包括两个类:Pat ...
  6. 这篇文章主要介绍了Java虚拟机JVM性能优化(三):垃圾收集详解,本文讲解了众多的JVM垃圾收集器知识点,需要的朋友可以参考下 Java平台的垃圾收集机制显著提高了开发者的效率,但是一个实现糟糕的垃圾收集器可能过多地消 ...
  7. 一.设计模式的分类 总体来说设计模式分为三大类: 创建型模式,共五种:工厂方法模式.抽象工厂模式.单例模式.建造者模式.原型模式. 结构型模式,共七种:适配器模式.装饰器模式.代理模式.外观模式.桥接模式.组合模式.享元 ...
  8. 编程语言的I/O类库中常常使用流这个抽象的概念,它代表任何有能力产生数据的数据源对象或时有能力接收数据的接收端对象,本文为大家介绍Java中I/O系统基础知识 "流"概念源于UNIX中的管道(pipe ...
  9. 本篇文章是对在Java中一些基础概念的使用进行了详细的分析介绍,需要的朋友参考下 类的初始化顺序 在Java中,类里面可能包含:静态变量,静态初始化块,成员变量,初始化块,构造函数.在类之间可能存在着继承关系,那么当我们 ...
  10. java(jsp)整合discuz同步登录功能详解

    jsp整合discuz同步登录功能详解,Uenter是Comsenz旗下各个产品之间信息直接传递的一个桥梁,通过UCenter站长可以无缝整合Comsenz系列产品,Center拥有机制完善的接口,经过简单修改便可以挂接 ...
  11. 本篇文章是对php中类常量的使用进行了详细的分析介绍,需要的朋友参考下 注意:不像其他的面向对象编程语言,在php中,类不能对某个属性变量使用final修饰符. 如果要声明某个属性为常量,可以使用const关键字,并且无 ...
  12. 这篇文章主要介绍了C#中File类的文件操作方法,以实例的形式详细分析了File类对文件的创建.打开.复制.删除等各种常用的操作,非常具有实用价值,需要的朋友可以参考下 本文实例讲述了C#中File类的文件操作方法.分享 ...
  13. 这篇文章主要介绍了PHP邮件发送类PHPMailer用法,详细的讲述了安装及配置的方法与功能实现代码,非常具有实用价值,需要的朋友可以参考下 本文实例讲述了PHP邮件发送类PHPMailer用法,并详细讲述了其具体的操作 ...
  14. 本篇文章是对PHP类的相关函数的使用进行了分析介绍.需要的朋友参考下 bool class_alias ( string $original , string $alias [, bool $autoload = TRU ...
  15. String:字符串类型 1.构造函数. String() :构造一个空字符串对象. String(byte[] bytes) :通过byte数组构造字符串对象. String(byte[] bytes, int off ...
  16. 在这篇文章里,我们关注线程同步的话题.这是比多线程更复杂,稍不留意,我们就会"掉到坑里",而且和单线程程序不同,多线程的错误是否每次都出现,也是不固定的,这给调试也带来了很大的挑战 首先阐述什么是同步 ...
  17. 本篇文章是对Java中Vector与ArrayList的区别进行了详细的分析介绍,需要的朋友参考下 首先看这两类都实现List接口,而List接口一共有三个实现类,分别是ArrayList.Vector和LinkedLi ...
  18. 本文是一系列关于Python正则表达式文章的其中一部分.在这个系列的第一篇文章中,我们将重点讨论如何使用Python中的正则表达式并突出Python中一些独有的特性 作为一个概念而言,正则表达式对于Python来说并不是 ...
  19. 深入Synchronized和java.util.concurrent.locks.Lock的区别详解

    本篇文章是对Synchronized和java.util.concurrent.locks.Lock的区别进行了详细的分析介绍,需要的朋友参考下 主要相同点:Lock能完成Synchronized所实现的所有功能. 主要 ...
分类列表
猜你喜欢
So far, has been moving down the keyboard key down box. Among the actual game box, they will fall down. This i ...
Just reinstall the system, but when the office will install a "language of the installation package from ...
Get started git clone git://github.com/ashleyw/Slate.git myapp cd myapp script ...
Knowledge points: Java 2D Enhancements Section Overview, AWT graphics lack of capacity, Java 2D API Section II ...

asp.net中System.Timers.Timer的使用方法,需要的朋友可以参考一下 我们经常会在网站中加一些定时执行的任务,比如生成静态页.执行邮件发送等. 可以通过在Global.asax中这样设置来实现. vo ...
标签
推荐阅读
阅读(1162) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~