Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1633968
  • 博文数量: 126
  • 博客积分: 1541
  • 博客等级: 上尉
  • 技术积分: 1914
  • 用 户 组: 普通用户
  • 注册时间: 2012-05-20 11:14
文章分类

全部博文(126)

文章存档

2014年(21)

2013年(42)

2012年(63)

分类: Python/Ruby

2013-01-10 10:25:54

perl中通过文件操作符glob提供相当于shell中的指定多个文件的“通配符”语法功能,文件操作符glob将返回与所指定的glob文件模式相匹配的所有文件的list。

例:@files = glob "/home/site/*.html"

@files = glob "[a-z]*

glob操作符有两种不同的形式:

@files = glob "*.pl";

@files = <*.pl>;

在此应该注意文件操作符glob与读行操作符的区别:Perl在遇到尖括号时,它会检查尖括号中的内容,从而确定其中的内容是否为文件句柄。

 

虽然是单一指令.... grep "sample" test.*
但test.1, test.2, test.xx, ...
也是一个一个开启关闭的...
foreach my $file (glob("test.*")){
  open FH,...;
  while(){
     if(m/sample/){
         ...;
     }
  }
  close FH;
}

 

用尖括号读文件是比较好,但当在变量上"执行文件操作符glob"时,必须在文件名两端加大括号,只有这样perl才不会将其当前文件进行操作,遇到这种情况,使用glob语法更为简单。

#当用<>尖括号读文件时

$file = yaodenglong.txt(文件名)

@content = <$file>

#当把<>尖括号当作glob,执行文件glob

$filepec = *.html;

@files = <${filepec}>;

@files = glob $filepec;

 

关于Perl glob,笔者建议阅读《Advanced Perl Programming》第一版的第三章和第二版的第一章。本文是笔者经过阅读以上内容并经过一些实践后完成的。

我们都知道Perl的引用类似C语言的指针。

C指针:
int a = 1;
int* pa;
pa = &a;
Perl引用:
my $a = 3;
my $ra = \$a;

引用都可以简单地看成是存储了变量的地址:

$a $ra
3 变量$a的地址

在各种语言里,都有符号表(Symbol Table)的概念。符号表存储着各种作用域里的符号(Symbol)。这里说的Symbol是指我们编程时用到的各种名称,包括变量名、函数名等。比如上面的“a”、“pa”、“ra”等都是symbol。看下面的代码:

my $a = "sdd";
my $b = 34;
my @b = (2,3);
my %b = (name => 'me', age => 28);
sub b {
print "hello\n";
}

产生的符号表:

... ...
symbol a 变量$a的地址
... ...
symbol b $b的地址 @b的地址 %b的地址 函数b的地址
... ...

可以看到symbol b里存放了好几个变量和函数的引用。在Perl里,symbol也可以被叫做glob。symbol b和symbal a可以分别用*b和*a表示。

glob的一个基本应用是alias(别名):

$a = 10;
*b = *a;
print $b . "\n";
$b = 20;
print $a . "\n";

运行结果:

10
20

符号表:

... ...
*a \$a
... ...
*b \$a
... ...

通过将引用赋给glob可以实现部分别名:

$a = 6;
@a = (1,2);
@b = (5,6);
print $a . "\n";
*b = \$a;
$b = 7;
print $a . "\n";

输出:

6
7

符号表:

... ...
*a \$a \@a
... ...
*b \$a \@b
... ...

可以看到,只是标量一样了,数组还是各自的。

还可以用于参数传递:

sub change {
*b = shift;
$b = "cc";
}
$a = "tt";
print $a . "\n";
change(*a);
print $a . "\n";

运行结果:

tt
cc

据说通过glob传递参数要比传引用快很多。

不同的作用域有不同的符号表:函数拥有自己的符号表,各个包也有自己的符号表。注意!词法变量(lexical variable,用my关键字声明的变量)不收入符号表。同时,也不能用my关键字来声明glob。my关键字只用来声明词法变量,glob不是词法变量。

《Advance Perl Programming》第二版里说:可以把glob看成一个很有限的hash,他只有几个key:SCALAR、ARRAY、HASH, IO, CODE, FORMAT和GLOB(笔者注:保存GLOB引用),另外还有两个key:PACKAGE和NAME(笔者注:仅做自省用)。比如一个 glob:a,*a{SCALAR}就相当于\$a,*a{HASH}就相当于\%a等等。

$a = 234;
print $a . "\n";
${*a{SCALAR}} = 345;
print $a

输出:

234
345

GLOB是Perl中几个比较难的概念之一。在Perl的核心库里,处处用到各种高深的glob技术。比如Exporter、AUTOLOAD、CORE等。虽然一般编程不需要用到特别深入的技术。如果能多了解一些,对于我们编程还是会大有益处的。

 

注意:*glob是不能声明的。glob广泛的应用在OO里。本质上glob是一个引用,并且创建一个符号表的入口。

[]$ perl -MData::Dumper -le '*myc={};print Dumper \%::' |grep myc
          'myc' => *::myc,

[]$ perl -MData::Dumper -le '*myc={};print Dumper \%myc'
$VAR1 = {};


原文地址:

http://blog.sina.com.cn/s/blog_7fbee6a10100w4ik.html

阅读(22539) | 评论(0) | 转发(1) |
给主人留下些什么吧!~~