perl 对文件排序经典实例(2009-10-20 16:26:40)标签:perl sort map 文件 排序 杂谈 分类:perl语言学习
perl 排序问题【实例】1
月份 电话号码 市话 长途 总话费(元)
-----------------------------------------------------------------------
200809 74889999 3.0 6.6 188
200810 74885444 4.0 1.0 200
200810 74885555 0.8 5.5 120
200810 74889888 4.0 1.0 200
要求:1,按月份(从小到大)排序。
2,按总花费(从大到小)排序。若总话费相等,则按号码(从小到大)排序
首先,按月份排序。同时,按总花费(从大到小)排序,若总话费相等,则按号码(从小到大)排序
最佳答案:
print map {$_->[-1]}
sort {$a->[0] <=> $b->[0] || $b->[1] <=> $a->[1] || $b->[2] <=> $a->[2]}
map {[(split)[0,4,1],$_]} ;
__DATA__
200809 74889999 3.0 6.6 188
200810 74885444 4.0 1.0 200
200810 74885555 0.8 5.5 120
200810 74889888 4.0 1.0 200
也可以这样:
#!/usr/bin/perl
use warnings;
use strict;
open (INFILE,"/home/liuguiyou/11.txt");
my @a=;
my @b;
@b= map {$_->[3]}
sort {$a->[0] <=> $b->[0] ||$b->[1] <=> $a->[1] ||$b->[2] <=> $a->[2]}
map {[(split)[0,4,1],$_]} @a;
close INFILE;
foreach (@b){
print "$_";
}
注:
第一:@b= map {$_->[3]} 是因为需要打印输出的位置前面已经有了3个元素,在这里可以写为@b= map {$_->[-1]},指的是从最后一个位置开始计算。
第二:sort {$a->[0] <=> $b->[0] ||$b->[1] <=> $a->[1] ||$b->[2] <=> $a->[2]}
是因为下面有三个条件,按照顺序[0,4,1], 并且这些条件之间用||分开
任何可以从 $a 和 $b 中得到的有用信息都可以在一个排序过程中比较的基础来用。比如,如果多行文本要根据特定域来排序,那么可以在排序过程中使用 split 以获取该域:
@sorted_lines = sort {
@a_fields = split /:/, $a; # 冒号分隔的域
@b_fields = split /:/, $b;
$a_fields[3] <=> $b_fields[3] # 对第四个域进行数字排序,然后
||
$a_fields[0] cmp $b_fields[0] # 对第一个域进行字串排序,然后
||
$b_fields[2] <=> $a_fields[2] # 对第三个域进行数字反向排序
... # 等等
} @lines;
perl 排序问题【实例】2
#!/usr/bin/perl
@by_uid = map { $_->;[0]} sort {$a->;[1] <=>; $b->;[1] } map { [$_,(split /:/)[2]] } ;;
for(@by_uid){print ."\n";}
__DATA__
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
nobody:x:99:99:Nobody:/:/sbin/nologin
mailnull:x:47:47::/var/spool/mqueue:/dev/null
rpm:x:37:37::/var/lib/rpm:/bin/bash
ident:x:98:98:pident user:/:/sbin/nologin
pcap:x:77:77::/var/arpwatch:/sbin/nologin
sshd:x:501:501::/dev/null:/dev/null
mysql:x:100:101:MySQL server:/var/lib/mysql:/bin/bash
cnhackTNT:x:0:0::/home/cnhackTNT:/bin/bash
chutium:x:504:504:Seraph Chutium:/home/chutium/:/bin/bash
源代码:
@by_uid = map { $_->;[0]} sort {$a->;[1] <=>; $b->;[1] } map { [$_,(split /:/)[2]] } ;;
以下对上面的根据uid来排序的code做出解释:
第一:;实际上可以看成一个数组,内容就是__DATA__下的那些,这里我们把它当作是@DATA这个数组(Apile原文里就是/etc下的passwd文件的内容)。
第二:map{[$_,(split /:/)[2]}从@DATA中取出每条数据,并对每条数据以 : 作为分割符分割,也就是 split(/:/,$_);然后返回一个数组@_,以sshd:x:501:501::/dev/null:/dev/null为例,那么这个返回的数组中的一项可以看成:$_=['sshd:x:501:501::/dev/null:/dev/null','501'];
从上可看出这个$_是一个匿名的数组引用,他实际上包含两个部分,其中第二部分是uid,也就是$_->;[1]
现在@_中的内容变成了:
....前面的省略.....
['rpm:x:37:37::/var/lib/rpm:/bin/bash','37']
['ident:x:98:98:pident user:/:/sbin/nologin,'98']
['pcap:x:77:77::/var/arpwatch:/sbin/nologin','77']
['sshd:x:501:501::/dev/null:/dev/null','501']
....后面的省略.....
第三:sort {$a->;[1] <=>; $b->;[1] }便是根据@_中的每项(实际上是数组引用)的第二部分uid的大小来排序,这里的sort排序是标准的方法,很多书里都有例子。
现在,经过上面的过程,数组@_中的内容已经以uid大小排好序了,现在我们只要按@_排好的顺序读取每一项内容的第一部分,以['sshd:x:501:501::/dev/null:/dev/null','501']为例,我们要取他的第一部分 'sshd:x:501:501::/dev/null:/dev/null',也就是$_->;[0],并将其保存到数组@by_uid中就好了,而map { $_->;[0]}很好的完成了这项工作。
实际上只要明掌握了map,sort的用法就能容易的理解上面算法的意思
转自
类似的问题:
阅读(3169) | 评论(0) | 转发(0) |