分类:
2010-11-12 00:31:00
Tie::File:
Tie::File - Access the lines of a disk file via a Perl array: 将一个file和array tie起来,对array所做的任何操作都会同步反映到file上,等同于对文件进行了操作。
注意:Tie::File模块不适用于处理存放大量短小记录的文件!!
这里所说的记录型文件,是指文件读写时的最小单位是记录而不是通常的字节。数据记录之间以记录分隔符隔开,故要求文件有效数据的内容不会与记录分隔符相混淆。通常我们使用的文本文件就属于记录型文件,它的记录分隔符在win32下是\r\n序列,在unix下则是\n。对于记录型文件,Perl提供了一个模块Tie::File将文件同一个数组关联起来,对数组进行操作就等价于对文件本身进行操作,数组内容所有的改变都会立即反映在文件中。更令人兴奋的是同文件相关的这个数组是一个“虚拟”数组,本身并不会占用多少空间,因此即使操作数以GB计的文件也十分轻松。其用法如下:
use strict;
use warnings;
use Tie::File;
my @lines; # 文件关联数组
my $filename='./test.dat'; # 记录文件名
tie(@lines,'Tie::File',$filename) or die; # 将记录文件同数组关联,默认为文本型文件
# 记录分隔符使用"\r\n"或"\n"
$lines[0]="Hello"; # 这里对数组内容的操作就直接反映到文件中去了
$lines[1]="world!"; # 增加一条新记录
splice(@lines,1,0,"insert another line"); # 在老记录之间插入记录
delete $lines[0]; # 删除记录
untie(@lines); # 解除文件同数组的关联
这就是对文本文件的一系列操作,可以看出该模块使用起来十分灵活简便。除此之外模块还有几个选项可以调整细节行为,常用选项如下:
1. recsep
类似于$/, 用来指定记录分隔符,分隔符可以是任意字符串。每条记录都不包含分隔符,但写入文件时都会自动附加上一个记录分隔符,如果记录内容本身已经附加有分隔符则会忽略。读出记录内容时会自动去除分隔符(由autochomp选项控制)。默认的记录分隔符是"\r\n"或"\n",我们可以任意改变它以适应自己的需求。唯一需要注意的地方就是记录分隔符不可与有效数据内容混淆,也不能为空(没有记录分隔符就谈不上记录型文件了)。
(@array, 'Tie::File', $file, recsep => 'es');
This says that records are delimited by the string es
. If the file contained the following data:
Curse these pesky flies!\n
then the @array
would appear to have four elements:
1."Curse th"
2 ."e p"
3."ky fli"
4."!\n"
2. autochomp
指定读出记录时是否去除记录分隔符,(默认)为真值时会自动去除分隔符。如:
Normally, array elements have the record separator removed, so that if the file contains the text
- Gold
- Frankincense
- Myrrh
the tied array will appear to contain ("Gold", "Frankincense", "Myrrh")(不包括换行)
If you set autochomp
to a false value, the record separator will not be removed. If the file above was tied with
- (@gifts, "Tie::File", $gifts, autochomp => 0);
then the array @gifts
would appear to contain ("Gold\n", "Frankincense\n", "Myrrh\n")
, or (on Win32 systems)("Gold\r\n", "Frankincense\r\n", "Myrrh\r\n")
.
3. splice
spice是perl命令,不是此模块所独有,用法如下:
splice ARRAY,OFFSET,LENGTH,LIST
splice ARRAY,OFFSET,LENGTH
splice ARRAY,OFFSET
splice ARRAY
从第offset个元素开始,删除长度为length个元素,若list存在,则 用list代替删除掉的数据(若lenght=0,则变成了添加)。若省略length,则删除从offset开始的所有数据。offset和length都省略则删除所有元素。
除此之外还有mode、memory、dw_size等选项。另外在指定选项时可以在选项前加一个“-”号,即tie(...,-recsep=>...)和tie(...,recsep=>...)这两种形式是等价的。对该模块的进一步说明请参考perldoc Tie::File
chinaunix网友2010-11-12 17:25:40
很好的, 收藏了 推荐一个博客,提供很多免费软件编程电子书下载: http://free-ebooks.appspot.com