Oracle中的正则表达式(Regular Expression)-TOMSYAN-ChinaUnix博客

美丽人生yanshoupeng.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

TOMSYAN

博客访问： 2919626
博文数量： 599
博客积分： 16398
博客等级：上将
技术积分： 6875
用户组：普通用户
注册时间： 2009-11-30 12:04

个人简介

WINDOWS下的程序员出身，偶尔也写一些linux平台下小程序，后转行数据库行业，专注于ORACLE和DB2的运维和优化。同时也是ios移动开发者。欢迎志同道合的朋友一起研究技术。数据库技术交流群：58308065，23618606

文章分类

全部博文（599）

移动开发（2）
防火墙（1）
脚本（6）
HADOOP（6）
透明网关（5）
工具（2）
DSI（2）
热点话题讨论（2）
oracle internal（28）
Jonathan Lewis（2）
ASKTOM（12）
OLAP（1）
C/Pro*c/c++（23）
PL/SQL（10）
ORACLE全文索引（5）
DB2（28）
METALINK（27）
AIX（4）
DELPHI（5）
性能优化（19）
分布式数据库管理（1）
书籍笔记（4）
备份与恢复（7）
数据库安装及升级（18）
资料下载（43）
Oracle高可用（32）
Linux（7）
Oracle（244）
未分配的博文（53）

文章存档

2014年（12）

2013年（56）

2012年（199）

2011年（105）

2010年（128）

2009年（99）

我的朋友

相关博文

Oracle中的正则表达式(Regular Expression)

分类： Oracle

2009-12-15 11:05:33

正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。

所谓正则表达式是对于字符串进行匹配的一种模式。举个例子来说字符串’^198[0-9]$’可以匹配‘1980-1989’，也即80后出生的年份。如果希望统计出公司那些员工是80后的，就可以使用如下的SQL语句：
select * from emp where regexp_like(to_char(birthdate,’yyyy’),’^198[0-9]$’);

这里用到了regexp_like和函数。

这里在正则表达式中用到的^、$、[0-9]都被称为元数据(metacharacter)，正则表达式都是由多元表达式组成的。在这里，^表示一个字符串的开头，$表示一个字符换的结尾，因此^198表示以198开头的字符串，而[0-9]$则表示以0-9的数字结尾的字符串。因此整体上’^198[0-9]$’就能匹配所有1980-1989的字符串。

正则表达式中常用到的元数据(metacharacter)如下：

^ 匹配字符串的开头位置。
$ 匹配支付传的结尾位置。
* 匹配该字符前面的一个字符0次，1次或者多次出现。例如52*oracle 可以匹配 5oracle,52oracle,522oracle,5222oracle等等。
+ 匹配该字符前面的一个字符1次或者多次出现。例如52+oracle 可以匹配 52oracle,522oracle,5222oracle等等
? 匹配该字符前面的一个字符0次或1次或者多次出现。例如52?oracle 只能匹配5oracle,52oracle等等
{n} 匹配一个字符串n次，n为正整数。例如：hel{2}o 所匹配的是hello
{n,m} 匹配一个字符串至少n次，至多m次。其中n和m都是整数。
. 匹配除了null之外的任何单个字符串
(pattern) 这个是用来匹配指定模式的一个子表达式
x|y 匹配x或者y，其中x和y是一个或者多个字符
[abc] 匹配括号中的任意一个字符。例如：[ab]bc可以匹配abc和bbc
[a-z] 匹配指定范围内的任意字符串。例如[A-G]hi可以匹配Ahi至Ghi
[::]指定一个字符类，可以匹配该类中的任意字符这里的字符类包括：
- [:alphanum:] 可以匹配字符0-9、A-Z、a-z
- [:alpha:]可以匹配字符A-Z、a-z
- [:blank:]可以匹配空格或者tab键
- [:digit:]可以匹配数字 0-9
- [:gragh:]可以匹配非空字符
- [:punct:]可以匹配. , ” ‘等标点符号。
- [:upper:]可以匹配字符A-Z
- [:lower:]可以匹配字符a-z

这里列出的是一些常见的正则表达式中的元数据。更多的正则表达式的内容请参照oracle官网上的正则表达式的相关内容

关于orace中的正则表达式只能通过oracle特意为正则表达式设计的4个函数来使用。这4个函数分别是：
regexp_like,regexp_instr,regexp_replace,regexp_substr。关于这4个函数的具体用法，会在稍后介绍，这里简单说一下：

regexp_like(x,pattern)当x能正确匹配字符串时返回true。
regexp_instr(x,pattern)在x中尝试匹配pattern，并返回匹配的位置。
regexp_replace(x,pattern,replacestring)在x中尝试匹配pattern,并将其替换成replacestring。
regexp_substr(x,pattern）返回x中匹配pattern的一个字符串。

前面我们介绍了组常用的一个，这里我们在介绍一个函数regexp_instr。这个函数用的不如前一个多，但也会偶尔会用到。这个函数其实与我们前面曾介绍的其实相似。

regexp_instr的原型如下：
regexp_instr(x,pattern[,start[,occurrence[,return_option[,match_option]]]])
这里每个参数分别含义如下：

x 待匹配的字符串
pattern 待匹配的模式
start 开始匹配的位置，如果不指定默认为1
occurrence 匹配的次数，如果不指定，默认为1
return_option 指定返回值的类型，如果该参数为0，则返回值为匹配位置的第一个字符，如果该值为非0则返回匹配值的最后一个位置。
match_option　可以用这个参数来修改一些默认的配置设置。这个值与前面所说的函数中的match_option参数的意义是一样的。

下面来举几个有关regexp_instr函数的例子：
select (’i love ’,'o[[:alpha:]]{4}e$’,1,1) as r from dual
这个例子从’i love ’这个字符串中匹配一个模式，这个模式是以o开头，以e结尾，在o和e之间有4个字符的字符串。这样自然而然就返回oracle的起始位置14

另一个例子是：
select (’i love ’,'o[[:alpha:]]{2}’,1,2,1) as r from dual
这个例子的含义是在’i love ’这个字符串中匹配另一个模式，这个模式是以o开始，再包含两个字符的一个模式，因此这个模式可以是ove，也可是ora但是我们要求它匹配两次，因此这个SQL语句的结果是ora所在的位置，所在的什么位置呢？因为我们的return_option参数的值是1，即大于0，所以这的结果是16,也就单词oracle中a所在的位置

阅读(11483) | 评论(0) | 转发(2) |

上一篇：ORACLE 资源包下载地址

下一篇：ORACLE 10gR2 RAC升级至10.2.0.4-(1)停止相关进程

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6