分类:
2010-04-23 23:35:52
很多人并不是把Perl当做第一门编程语言来学习的,在学Perl之前往往已经掌握了一两门其它语言。虽然有争议,但是我个人认为Perl确实不适合作为入门语言。这篇文章就是写给那些熟悉C而且又想掌握Perl的程序员,介绍一些技巧以及如何避免C程序员常犯的错误,带你渡过危险的沼泽。在读这篇文章之前,请先查看perltrap的手册页,里面有很多有用的信息,这里不再重复。欢迎来到Perl的魔法世界!
C语言的设计者Dennis Ritche说:“C语言诡异离奇,缺陷重重,却获得了巨大的成功。 ”这大概是因为C的抽象程度碰巧既满足了程序员的要求, 又容易实现。钟爱C的人都乐意写一些稀奇古怪的C程序,并以此展示自己的才能。Perl在这方面更可谓是“有过之而无不及”。 Perl丑陋而又抽象,完全可以用来写混乱代码,但它又灵活实用,而且更接近自然语言,也可以用来写诗。这本身就很有意思。在C擅长的底层领域,Perl只能望尘莫及,毕竟它天生不是用来和硬件打交道的。但在文本处理领域,C只好俯首称臣了,而Perl在这方面非常强大。据说,Perl也得到了很多生物学家的青睐,在很大程度上帮助了人类基因组计划。谢谢Larry Wall!
Perl结合了多种编程语言的特性,C语言也在其中。Perl和C有以下相同之处:
然而,Perl和C毕竟是两种完全不同的编程语言,从C转向Perl有很多值得注意的地方。我们在下面详细讨论。
这不是说Perl使用的是匈牙利表示法,而是Perl的特性。 在Perl中,$说明变量是一个scalar,@表明变量是一个array,而%说明后面的变量是一个hash。比如:@foo是一个数组,而$foo[0]是数组@foo中第一个元素,@foo[0]是一个数组片段,当然也是数组,但这个片段只有一个元素$foo[0]。如果你数组变量把赋给一个标量,比如:$bar=@foo;,你将得到的是该数组中元素的个数。
在C中你每引入一个变量,都要在前面声明它的类型。在Perl中完全没有必要,你可以在任何时候任意引入新的变量。不过,问题就出来了,你可得当心。如果你不小心敲错一个字母,Perl会把它当成你新引入的变量,并且自动初始化,有时不会给出任何错误提示,而这显然与你的最初目的不符!所以,最后在每个Perl程序的前面都加上use strict;,确保perl能对代码进行更严格的检查,就像你使用lint检查C程序那样。
Perl中的标量类型范围很广,可以是整数,可以是字符串,也可以是浮点数。你可以很安全地把一个整数默默地转化成相应的字符串。Perl解释器能够理解你的意思,不用担心。但是,这并不是说任何时候你都可以高枕无忧,把字符串“转化”成整数时,你确实得下一番功夫。我们在下面将会讨论这个问题。
Perl中没有char这种类型。
$ch='c';上面的语句其实是给标量$ch赋了一个字符串值,因为Perl中单引号也能括起字符串(对比单引号和双引号的不同留做练习)。正因如此,才使得把字符串转化成整数或者浮点数变得稍微麻烦了些。我们可以这样这样处理字符:
当然也可以使用正则表达式。Perl中也有类似atoi()的函数,叫作POSIX::strtod,在POSIX模块中,使用前应该先包含它。@array = split(//, $string); # each element a single character @array = unpack("C*", $string); # each element a code point (number)
由于Perl中没有整数和浮点数类型的区分,所以当你想按照C的意思用/操作符表示整除时,它并非你想要的。实际上/在Perl中是浮点除法,下面的程序是危险的:
它会把$a精确地除到小得Perl无法表示它!如果你想表示整除,请将整个表达式放入int函数中。while($a/=2) { push @tmp, $a % 2; }
当心:在Perl中只有hash是使用{}初始化的,普通数组array是使用 ()进行初始化的!使用{}给普通数组赋值解释器会报错。而且,Perl中的数组是可以任意伸缩的,不存在数组越界问题。不像C,Perl允许有匿名数组/散列/子函数,比如使用匿名数组交换两个变量的值:
($var1, $var2) = ($var2, $var1);Perl数组脱离了底层特性,而且更加灵活方便。
这实在是让C程序员们吃惊,Perl居然没有switch。的确,Perl并不需要switch ,因为switch完全可以用if/elsif/else(注意:是elsif而不是else if)或者?:来代替。Perl中的switch可以这样来写:
当然你也可以使用goto,毕竟TMTOWTDI(There's More Than One Way To Do It.)。SWITCH: { if ($value == 1) { print "One" }; if ($value == 2) { print "Two" }; if ($value == 3) { print "Three" }; if ($value > 3) { print "Unknown" }; } #Or like this: SWITCH: { $value == 1 and print "One", last; $value == 2 and print "Two", last; $value == 3 and print "Three", last; print "Unknown"; #default }
如果你决定使用Perl编程,那么你可以完全绕开struct这类东西。union 是更为底层的东西,更不应该出现在Perl中。如果你想用struct实现数据结构,比如单链表,那么在Perl 中你可以选择hash和reference。其实hash可以实现很多数据结构,更详细的内容见《Mastering Algorithms with Perl》一书。如果你想用struct实现class,那么你可以使用Perl中的object。最后,如果你说:“我不用struct完成不了这个程序”,那你怎么不考虑用C而用Perl呢?
Perl中的条件和循环语句块都需要用{}括起来,因此也就不存在悬空的else问题。记住:块(block)本身就相当于一个只执行一次的循环,因此last对block也起作用。有点例外的情况是当条件判断出现在一条语句的最后时,前面没必要加花括号。比如:
if $test print "yes"; #This one is WRONG! {print "yse"} if $test; #WRONG again! print "yes" if $test; #This one is right.
do在Perl中被赋予三种不同的含义。当它后面是一个block时,它会把后面块中的语句都执行一遍,并且返回最后一个表达式的值;如果它和while或者until连用,Perl会通过测试条件来决定执行块中的语句,但是,块中的语句不会被计算在循环之中。所以,使用last/next/redo来控制块是没用的。当它后面是一个文件名时,它的作用是把名为此的文件包含进来。当它后面是一个子函数时,它是对后面子函数的调用,但这是一种不推荐使用的方式。
你再也不用担心free和malloc函数造成内存泄漏了,因为在Perl中没有那种函数,也没有指针,你几乎不用关心内存分配问题。Perl中类似指针的reference,没有底层的那些特性。实际上,在Perl中造成内存泄漏是很罕见的。你再也不用害怕字符串空间不够用,字符串是否以'\0'结尾这种问题了,Perl中的字符串像 C++中的String类一样方便,就是没有C++重载运算符带来的连接和比较字符串的实惠(Perl也可以重载运算符,在这里不讨论)。
Perl被设计成与自然语言很接近的计算机语言,这也就无怪乎用Perl也能写出诗来了。函数参数不必都用圆括号括起来。虽然加上圆括号也没什么影响,但是你得知道,不加括号可以让你的程序更易读,更优雅。试比较下面的语句:
open (YOUREYES, $wide) or die ("$!");这是Perl,放轻松点儿。更进一步,如果你不想转递给函数任何参数,不用带多余的圆括号;但是如果你也想同样处理你自己写的子函数,你必须在使用之前就定义或者声明那个函数。
open YOUREYES, $wide or die $!;
此外,Perl很好地支持可变参数,而且Perl传递函数参数实际上是引用传递,而不是像C那样采用值传递!换句话说,你对@_中的元素进行修改,那么相应的实参也会变化。Perl采用这种方法可以很容易地返回所需要的值。
Perl中的函数原型是调用环境中的自动模板,而不像C中的那样。而且函数原型只影响那些不带&方式调用的函数。你必须十分注意函数原型是否将你的子函数带入了一个新的环境。因此,“最好在新函数中使用函数原型,但别在旧函数中使用函数原型。”如果你不小心,你可能因函数原型遇到很多麻烦。但如果你非常谨慎,你可以用函数原型出色地完成任务。
C家族的语言都必须有一个main函数,而Perl不在其中。和Basic类似,Perl也没有main函数,自顶向下解释执行。Perl中命令行界面的参数是通过@ARGV数组传递的,而且没有$ARGC变量,因为把@ARGV赋给一个标量就能得到参数个数。不过,Perl中的$ARGV[0]相当于C的argv[1],相当于argv[0] 的变量是$0。C中环境变量是通过main的参数char** env传递的,而Perl通过%ENV散列。
Perl中所有可能是左值的东西都可以作为左值。比如,如果?:操作符的两部分表达式都是左值,那么整个表达式也可以是左值。函数也可以是左值,若substr函数的第一个参数运算后是可修改的,它也可以用作左值。你也可以把自己的子函数定义成可以作为左值使用的,是的,Perl允许你这么做。就像这样:
它可以很安全地把右值赋给$var。my $val; sub canuse : lvalue { $val; } canuse() = 9;
Perl的一大特点就是它有很多预定义好的变量,它们都有各自专门的用途,这和C大不相同。你必须熟悉它们才能驾驭它们。$_可能是最常用的隐含变量了,它是输入和模式匹配中默认的变量/参数;@_是用于传递子函数参数的列表;$!保存着最近一次系统调用的错误信息(相当于C中的errno)…… 还有很多其它。隐含变量虽然看起来有点古怪,但当你熟悉它后,它能给你节省很多时间,增加程序的可读性。
当然,Perl的魔力和魅力远不止如此。Perl有着自己独特的风格,散发着自己的光芒。你应该用心去寻找Perl中的pearl!愿你也能用Perl创造更多的奇迹,更多的艺术!