perl 对文件排序经典实例-snowtty-ChinaUnix博客

冰雪塵埃snowtty.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

snowtty

博客访问： 5435246
博文数量： 1144
博客积分： 11974
博客等级：上将
技术积分： 12312
用户组：普通用户
注册时间： 2005-04-13 20:06

文章分类

全部博文（1144）

技术--Oracle&MyS（112）
编程--python编程（21）
编程--perl程序（183）
技术--防火墙类（9）
技术--samba类（7）
技术--apache类（18）
技术--netfilter（7）
工作--工作??（62）
生活--情感生活（116）
学习--英语学习（24）
学习--早先日志（46）
工作--周报总结（36）
学习--学习笔记（45）
技术--Rsync维护（11）
技术--OPENldap（1）
技术--squid维护（9）
技术--DNS 维护（17）
技术--FTP 维护（7）
技术--qmail维护（128）
技术--网络技术（26）
技术--linux 类（183）

openvpn（0）

nagios（10）
编程--awk&sed（11）
编程--shell编程（50）
未分配的博文（15）

文章存档

2017年（2）

2016年（14）

2015年（10）

2014年（28）

2013年（23）

2012年（29）

2011年（53）

2010年（86）

2009年（83）

2008年（43）

2007年（153）

2006年（575）

2005年（45）

我的朋友

相关博文

perl 对文件排序经典实例

分类： LINUX

2009-11-29 16:45:03

perl 对文件排序经典实例(2009-10-20 16:26:40)标签：perl sort map 文件排序杂谈分类：perl语言学习

perl 排序问题【实例】1

月份       电话号码             市话      长途      总话费（元）
-----------------------------------------------------------------------
200809        74889999        3.0        6.6        188
200810        74885444        4.0        1.0        200
200810        74885555        0.8        5.5        120
200810        74889888        4.0        1.0        200

要求：1，按月份（从小到大）排序。
2，按总花费（从大到小）排序。若总话费相等，则按号码（从小到大）排序
首先，按月份排序。同时，按总花费（从大到小）排序，若总话费相等，则按号码（从小到大）排序

最佳答案：

print map {$_->[-1]}
    sort {$a->[0] <=> $b->[0] || $b->[1] <=> $a->[1] || $b->[2] <=> $a->[2]}
    map {[(split)[0,4,1],$_]} ;
__DATA__
200809        74889999        3.0        6.6        188
200810        74885444        4.0        1.0        200
200810        74885555        0.8        5.5        120
200810        74889888        4.0        1.0        200

也可以这样：
#!/usr/bin/perl
use warnings;
use strict;
open (INFILE,"/home/liuguiyou/11.txt");

my @a=;
my @b;
@b= map {$_->[3]}
    sort {$a->[0] <=> $b->[0] ||$b->[1] <=> $a->[1] ||$b->[2] <=> $a->[2]}
    map {[(split)[0,4,1],$_]} @a;
close INFILE；
foreach (@b){
         print "$_";

}
注：
第一：@b= map {$_->[3]} 是因为需要打印输出的位置前面已经有了3个元素，在这里可以写为@b= map {$_->[－1]}，指的是从最后一个位置开始计算。
第二：sort {$a->[0] <=> $b->[0] ||$b->[1] <=> $a->[1] ||$b->[2] <=> $a->[2]}
是因为下面有三个条件，按照顺序[0,4,1], 并且这些条件之间用｜｜分开

任何可以从 $a 和 $b 中得到的有用信息都可以在一个排序过程中比较的基础来用。比如，如果多行文本要根据特定域来排序，那么可以在排序过程中使用 split 以获取该域：

   @sorted_lines = sort {
      @a_fields = split /:/, $a;      # 冒号分隔的域
      @b_fields = split /:/, $b;

      $a_fields[3] <=> $b_fields[3]   # 对第四个域进行数字排序，然后
         ||
      $a_fields[0] cmp $b_fields[0]   # 对第一个域进行字串排序，然后
         ||
      $b_fields[2] <=> $a_fields[2]   # 对第三个域进行数字反向排序
      ...            # 等等
   } @lines;

perl 排序问题【实例】2
#!/usr/bin/perl

@by_uid = map { $_->;[0]} sort {$a->;[1] <=>; $b->;[1] } map { [$_,(split /:/)[2]] } ;;
for(@by_uid){print ."\n";}

__DATA__
root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
nobody:x:99:99:Nobody:/:/sbin/nologin
mailnull:x:47:47::/var/spool/mqueue:/dev/null
rpm:x:37:37::/var/lib/rpm:/bin/bash
ident:x:98:98:pident user:/:/sbin/nologin
pcap:x:77:77::/var/arpwatch:/sbin/nologin
sshd:x:501:501::/dev/null:/dev/null
mysql:x:100:101:MySQL server:/var/lib/mysql:/bin/bash
cnhackTNT:x:0:0::/home/cnhackTNT:/bin/bash
chutium:x:504:504:Seraph Chutium:/home/chutium/:/bin/bash

源代码：
@by_uid = map { $_->;[0]} sort {$a->;[1] <=>; $b->;[1] } map { [$_,(split /:/)[2]] } ;;

以下对上面的根据uid来排序的code做出解释：

第一：;实际上可以看成一个数组，内容就是__DATA__下的那些，这里我们把它当作是@DATA这个数组(Apile原文里就是/etc下的passwd文件的内容）。

第二：map{[$_,(split /:/)[2]}从@DATA中取出每条数据，并对每条数据以 : 作为分割符分割，也就是 split(/:/,$_);然后返回一个数组@_，以sshd:x:501:501::/dev/null:/dev/null为例，那么这个返回的数组中的一项可以看成：$_=['sshd:x:501:501::/dev/null:/dev/null','501'];
从上可看出这个$_是一个匿名的数组引用，他实际上包含两个部分,其中第二部分是uid，也就是$_->;[1]
现在@_中的内容变成了:

....前面的省略.....
['rpm:x:37:37::/var/lib/rpm:/bin/bash','37']
['ident:x:98:98:pident user:/:/sbin/nologin,'98']
['pcap:x:77:77::/var/arpwatch:/sbin/nologin','77']
['sshd:x:501:501::/dev/null:/dev/null','501']
....后面的省略.....

第三：sort {$a->;[1] <=>; $b->;[1] }便是根据@_中的每项(实际上是数组引用)的第二部分uid的大小来排序，这里的sort排序是标准的方法，很多书里都有例子。
现在，经过上面的过程，数组@_中的内容已经以uid大小排好序了，现在我们只要按@_排好的顺序读取每一项内容的第一部分，以['sshd:x:501:501::/dev/null:/dev/null','501']为例，我们要取他的第一部分 'sshd:x:501:501::/dev/null:/dev/null'，也就是$_->;[0],并将其保存到数组@by_uid中就好了，而map { $_->;[0]}很好的完成了这项工作。
实际上只要明掌握了map,sort的用法就能容易的理解上面算法的意思
转自
类似的问题：

阅读(3192) | 评论(0) | 转发(0) |

上一篇：Perl 倒行分析文件方法。perl读文本文件，从末尾往前读.

下一篇：perl中seek函数的用法

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6