分类: Python/Ruby
2012-03-22 18:20:44
在Perl处理list中,很方便的module, List-Compare
有三种case: Regular Case, Accelerated Case, Multiple Case
Regular Case:
1.下载List-Compare模块
2.安装模块
tar xvzf List-Compare-0.37.tar.gz
cd List-Compare-0.37
perl Makefile.PL
make
make test
sudo make install
3.例子:
#!/usr/bin/perl -w
use strict;
use List::Compare;
my @Llist = qw(abel abel baker camera delta edward fargo gofler);
my @Rlist = qw(baker camera delta delta fargo hilton);
my $lc = List::Compare->new(\@Llist,\@Rlist);
my @intersection = $lc->get_intersection;
my @union = $lc->get_union;
print @intersection;
print "\n";
print @union;
其他接口:
1: 1.1 new(),在将list组合在一起时,会自动的按照顺序来排序
$lc = List::Compare->new(\@Llist, \@Rlist);
$lc = List::Compare->new('-u', \@Llist, \@Rlist);
参数-u的作用,每次compare, List::Compare都会按照Perl's default sort mode: ASCII-betical来进行排序,如果你不需要排序,而需要效率,则使用-u参数。
或者你可以使用
$lc = List::Compare->new('--unsorted', \@Llist, \@Rlist);
1.2 在perl中,hash和array可以互相转换,所以你也可以用hash来构造:
$lc = List::Compare->new( { lists => [\@Llist, \@Rlist] } );
$lc = List::Compare->new( {
lists => [\@Llist, \@Rlist],
unsorted => 1,
} );
2: 工作中主要的接口:注意在构造函数中list的顺序是影响结果的。因为在工作中,我们可能想知道,出现在第一个集合,而不出现在其他集合,或者类似的情况。
get_intersection() 两个或者多个list的交集。
get_union() 两个或者多个list的并集。
get_unique() 出现在第一个(at least once 指的是集合中可能会有重复的元素,在整个系列中,都需要注意这样的case)集合,但不出现在第二个集合的list.(LeftOrphan)
get_complement() 出现在第二个集合,但不出现在第一个集合的list ( RightOrphan)
get_symmetric_difference() LeftOrphan+RightOrphan的并集。
get_bag() 将会尽可能多的保存重复的元素,不像get_union,只保留一份copy.
3: 在2中提到的常用接口,有另外一个版本,都知道在perl中,如果用引用来操作,特别是在函数的传递中,能更加如鱼得水。Module提供了引用的版本。可谓用户至上。
$intersection_ref = $lc->get_intersection_ref;
$union_ref = $lc->get_union_ref;
$Lonly_ref = $lc->get_unique_ref;
$Lonly_ref = $lc->get_Lonly_ref; # alias
$Ronly_ref = $lc->get_complement_ref;
$Ronly_ref = $lc->get_Ronly_ref; # alias
$LorRonly_ref = $lc->get_symmetric_difference_ref;
$LorRonly_ref = $lc->get_symdiff_ref; # alias
$LorRonly_ref = $lc->get_LorRonly_ref; # alias
$bag_ref = $lc->get_bag_ref;
4:很多时候,我们并不需要知道里面每个元素,我们只需要一个判断。
is_LsubsetR(), Left list is a subset of Right list. 直接返回true.
is_ RsubsetL(), Right List is a subset of Left list. 直接返回true.
is_LequivalentR(), 二者含有一样的元素,这里的相等,和perl中的相等不一样。下面两个集合也相等。
my @Rlist = qw(baker camera delta delta fargo hilton);
my @Mlist = qw(baker cam delta delta fargo hilton hilton);
is_LdisjointR,如果intersection为空,则返回true.
print_subset_chart,print_equivalence_chart 很多时候,我们都需要将结果展示,module提供了一系列统计和展示的方法,如果需要你可以用,boss喜欢这样的展示。
is_member_any(),are_members_any(),元素是在太多了,你可以手动的指定某个元素是否在集合中。
其实还有很多功能在模块中实现:
Accelerated Case,
Multiple Case: Compare Three or More Lists
但功能都和上述讲解的相同。