Linux -- C -- regex 正则表达式-cnscn2008-ChinaUnix博客

cnsLinux博客

首页　| 　博文目录　| 　关于我

cnscn2008

博客访问： 1682572
博文数量： 4
博客积分： 10010
博客等级：上将
技术积分： 7710
用户组：普通用户
注册时间： 2006-01-21 17:07

个人简介

linux and c

文章分类

全部博文（4）

程序C/PHP/Python（2）

XML/AJAX（0）

socket（0）

文件及目录操作（0）

PHP（0）

c++高级编程（0）

C_C++编程（0）

基础知识（1）

进程／线程控制（0）

实际用例（0）

Javascript（0）

知识（0）

线进程（0）

Java（0）

python（0）

PERL（0）

汇编语言（0）

处理MySQL（0）

错误处理和报告（0）

文件系统（0）

Unix高级编程（0）

常用工具（0）

动态（0）

正则（0）

环境变量（0）

记录（0）

进程通信IPC（0）

Socket（0）

管道（0）

错误处理（0）

信号（0）

文件目录（0）

格式化输入输出（0）

进程（0）

输入输出（0）

随机数函数（0）

数据结构（0）

加密（0）

用户（0）

内存（0）

数据转换（0）

字符（0）

时间（0）

数学（0）

字符串（0）

数据结构与算法（0）

网络（0）

驱动（0）

C函数库（0）
windows（0）
数据库（0）

oracle（0）

MySQL（0）
编辑工具Vi、Emac（0）

emacs专栏（0）

VI专栏（0）
Unix/Linux（0）

数据恢复（0）

系统设置（0）

DNS（0）

内核分析及编程（0）

流媒体服务（0）

NFS（0）

系统与性能（0）

sysadmin（0）

知识点滴（0）

防火墙（0）

VPN服务器（0）

路由器（0）

桌面与汉化（0）

服务器（0）

安全（0）

shell（0）

squid（0）

Jabber（0）

Shell经典教程（0）

实用脚本（0）

内核（0）

samba（0）

cvs（0）

ssh（0）

mail（0）

ftp（0）

apache（0）

sed（0）

awk（0）

csh（0）

bash（0）

常用命令（0）
知识与资讯（1）

资讯（0）

理论（0）

论点（1）

开源软件应用（0）

mantis的应用（0）
生活与外语（0）

词汇（0）

英语（0）

衣食住行（0）
硬件（0）
未分配的博文（1）

文章存档

2015年（2）

2011年（1）

2008年（1）

我的朋友

相关博文

Linux -- C -- regex 正则表达式

分类： C/C++

2015-11-15 12:13:39

Linux C 正则表达式，已经循环匹配所有符合的字符串

#include <stdio.h>
#include <strings.h>
#include <regex.h>
char *string = " i love you love baby ";
//截取子字符串
char* substring(const char* str, size_t begin, size_t len)
{
if (str == 0 || strlen(str) == 0 || strlen(str) < begin || strlen(str) < (begin+len))
return 0;
return strndup(str + begin, len); //使用strndup()出来的字符串，需要free()
}
//正则匹配，只搜索字符串中第一个符合的子字符串
int regex_search(const char *str, const char *regex, regmatch_t pmatch[], int nmatch)
{
regex_t preg;
bzero(&preg, sizeof(regex_t));
if(regcomp(&preg, regex, REG_EXTENDED) == 0)
{
if(regexec(&preg, str, nmatch, pmatch, 0) == 0)
return 0;
else
return -1;
}
else
{
return -2;
}
}
//统计符合正则的子字符串的所有个数
int substr_count(char *str, const char *sub)
{
int i=0;
char *p = str;
while(p)
{
if((p=strstr(p,sub)))
{
i++;
p+=strlen(sub);
}
else
{
break;
}
}
return i;
}
int main()
{
//正则表达式
char *regex = "lo(v)(e)";
int i=0,len=0;
//统计左括号的个数，用于判断正则表达式中有多少(),+1是因为除()外，整个正则字符串也算一个，虽然不准，但也可以
int nmatch = substr_count(regex, "(")+1;
//根据regex中的()个数，设置一次正则匹配会有多少个分组
regmatch_t pmatch[nmatch];
int k=0;
int ind=0;
int j = 0;
//循环进行正则匹配
for( j=0; j<strlen(string); )
{
char *p;
p=string+j;
//单次正则匹配
if(regex_search(p, regex, pmatch, nmatch) == 0)
{
//遍历单次匹配的所有分组
for(i=0; i<nmatch;i++)
{
//单分组的模式匹配开始位置
if(pmatch[i].rm_so == -1 )
continue;
//第一个分组是整个完整正则表达式 l(o)(v)e匹配，比如 "i love you love you" ,记录love中e的位置，赋给p，用于对后面的字符串继续匹配正则
if(i==0)
j=j+pmatch[i].rm_eo;
//获取匹配串的长度
len = (pmatch[i].rm_eo - pmatch[i].rm_so);
//输出字符串
printf("found %lld-%lld %s \n", pmatch[i].rm_so, pmatch[i].rm_eo,substring(p,(int)pmatch[i].rm_so, (int)(pmatch[i].rm_eo - pmatch[i].rm_so) ));
}
}
else
{
break;
}
}
return 0;
}
//输出
userdeMac:stardict user$ ./a.out
found 3-7 love
found 5-6 v
found 6-7 e
found 5-9 love
found 7-8 v
found 8-9 e

阅读(562) | 评论(1) | 转发(0) |

上一篇：垃圾的评论管理

下一篇：没有了

给主人留下些什么吧！~~

cnscn20082015-11-15 12:14:17

/**
  preg   存放编译后的结果
  regex  正则表达式字符串
  cflags
         REG_EXTENDED 使用扩展正则表达式
         REG_ICASE    忽略大小写
         REG_NOSUB    忽略参数nmatch和pmatch
         REG_NEWLINE  特殊字符不以换行字符做比较

  int regcomp(regex_t *preg, const ch

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6