perl模式匹配单行模式与多行模式混合使用的一点内容-lanmeibanban-ChinaUnix博客

拥抱晴空embracethesky.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

lanmeibanban

博客访问： 615108
博文数量： 69
博客积分： 2204
博客等级：大尉
技术积分： 808
用户组：普通用户
注册时间： 2009-10-11 22:37

个人简介

..微笑着看着杯中的花茶一片片撑开.. ..透明的花瓣里水破开的声音很轻微..

文章分类

全部博文（69）

bioinformatics（10）

ncRNA（1）

可变剪接（1）

基因组&转录组（5）

系统发育（3）
数学（1）
Linux（23）

VIM（3）

KDE（1）

GNOME（2）

命令集（8）

基本设置（9）
Perl（14）

Perl_图形化（3）

Perl_网络（4）

Perl_线程&进程（2）

Perl_基础（5）
R（7）

R_图形（1）

R_基础（6）
Network（3）
Database（2）

Mysql（2）
C++（7）

C++编译（2）

C++_开发环境（5）
Windows（2）
未分配的博文（0）

文章存档

2018年（1）

2017年（2）

2016年（10）

2015年（8）

2014年（6）

2013年（6）

2012年（4）

2011年（8）

2010年（12）

2009年（12）

我的朋友

相关博文

perl模式匹配单行模式与多行模式混合使用的一点内容

分类： PERL

2013-07-30 17:18:52

今天见到一个表达式 $line =~ m/^@([^\n]+)$/xmso; 一直没搞懂是什么意思。翻了半天资料最后在《Perl cookbook》中找到了答案。
具体内容详见：《Perl cookbook 第二版》第六章，第六节（197页）或第一版的相同章节。

我们知道perl可以自定义文件中行的分割符，虽然默认的是‘\n’，但是也可以一次将文件中的所有‘行’读入在一个字符串变量中。然后在对这个字符串变量进行模式匹配的分析。假设有文件内容如下：

%abcdef
12734832794912834789
%djenuiv
3748998585939190
...

如果一次读入在一个变量中,就是：

%abcdef\n12734832794912834789\n%djenuiv\n3748998585939190 ...

先说锚定符，如果在单行模式 /s 下使用^或$来表示匹配开始或末尾的话，那么^、$将匹配的是字符串的开头和末尾，而并不是以‘\n’为概念的行的开头和末尾，如果想匹配‘\n’为概念的行的开头和末尾，则要与多行模式混合 /m 使用，即 m/你的模式/sm，但是这还取决于另一个元字符——'.'。

再说下元字符'.'，我们知道‘.’在模式匹配中表示任意字符。那么在混合模式下，如果你用m/^(.+)$/ms。你猜猜你得到的是什么，实际上是从字符串的开头到末尾的字符，而不是每行的内容，以上面的内容为例：

点击(此处)折叠或打开

my $line = "\%abcdef\n12734832794912834789\n\%djenuiv\n3748998585939190"; #因为是直接写的字符串，所以要将%符号转义，否则会判断为哈希结构。
$line =~ m/^%(.+)$/ms;
print $1;

此时的输出为：
abcdef
12734832794912834789
%djenuiv
3748998585939190

实际是从字符串第一个%开始直到字符串末尾。

可是如果想匹配的是‘\n’分割的行内的任意字符怎么办呢？实际上就如最前面的例子一样，用[^\n]来代替这个‘.’。

修改下前面的例子：

点击(此处)折叠或打开

my $line = "\%abcdef\n12734832794912834789\n\%djenuiv\n3748998585939190";
$line =~ m/^%([^\n]+)$/ms;
print $1;

现在输出结果为：
abcdef

如果将所有匹配的内容返回给数组的话：

点击(此处)折叠或打开

my $line = "\%abcdef\n12734832794912834789\n\%djenuiv\n3748998585939190";
my @match = $line =~ m/^%([^\n]+)$/msg;
print join ',', @match;

结果如下：
abcdef,djenuiv

结束！

阅读(4131) | 评论(0) | 转发(0) |

上一篇：sed新手使用进阶全功略

下一篇：Bioconductor对芯片探针信息进行注释

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6