Chinaunix首页 | 论坛 | 博客
  • 博客访问: 48810
  • 博文数量: 43
  • 博客积分: 1161
  • 博客等级: 少尉
  • 技术积分: 425
  • 用 户 组: 普通用户
  • 注册时间: 2010-04-24 11:14
文章分类
文章存档

2011年(40)

2010年(3)

分类: Python/Ruby

2011-05-14 18:52:40

有这么一种情况:要对一个数组中的元素排序,而排序规则是一个自定义的函数。

典型的代码结构是这样的:
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;
  4. use Data::Dumper;
  5. {
  6.     my $call_total=0;
  7.     sub ask_monkey_about(){
  8.         my $people=shift;
  9.         ++$call_total;
  10.         return$people;
  11.     }
  12.     sub get_total(){
  13.         return$call_total;
  14.     }
  15. }
  16. my @cataways=qw(Gilligan Skippers Professor Ginger Mary_Ann Thurston Lovey);
  17. my @wasters=sort {&ask_monkey_about($a) cmp &ask_monkey_about($b)} @cataways;
  18. print &get_total(),"\n";

要对@cataways中的元素排序,规则在子程序ask_monkey_about中定义了(这里是个示意,所以什么也没干,直接这回原值)。

排序的时候,直接把子程序写在sort语句中。

变量$call_total用来计算子程序被调用了多少次。

从输出结果可以看到,有7个元素的数组排序,子程序被调用了26次。

而实际上,叧要调用7次就完全足够了。多出来的19次完全是重复调用。如果未加任何优化,当待排序的元素个数很多时,规则子程序的调用次数会更加多,如对一个有1000个数的数组排序,按17行的写法,规则子程序会被调用将近2000次。这样做太傻了,白白的付出了多一倍的子程序调用开销,如果规则更加复杂,程序的效率就非常低。

有一个办法可以避免多出来的调用——先把规则子程序的返回值算出来。
  1. #!/usr/bin/perl
  2. use strict;
  3. use warnings;
  4. use Data::Dumper;
  5. {
  6.     my $call_total=0;
  7.     sub ask_monkey_about(){
  8.         my $people=shift;
  9.         my $people=shift;
  10.         ++$call_total;
  11.         return $people;
  12.     }
  13.     sub get_total(){
  14.         return $call_total;
  15.     }
  16. }
  17. my @cataways=qw(Gilligan Skippers Professor Ginger Mary_Ann Thurston Lovey);
  18. my @names_and_pineapples=map {
  19.     [$_,&ask_monkey_about($_)]
  20. } @cataways;
  21. my @wasters=sort {$a->[1] cmp $b->[1]} @names_and_pineapples;
  22. my @names=map $_->[0] @wasters;
  23. print &get_total(),"\n";
在上面这段程序的第17~19行,先将待排序数组的每个规则返回值都计算出来了,并把原值和返回值放在一个匿名数组中,作为一个中间结果集@names_and_pineapples的元素。即,@names_and_pineapples中有scalar @cataways个匿名数组,每一个匿名数组中有2个元素,分别是@cataways1个元素的原值和规则返回值。然后以中间结果集为对象进行排序,排序关键字是其中的规则返回值。排序结束后,在排序结果集中取出原值即可。这样,规则子程序叧调用了和待排序对象个数一样的次数,在这里是7次。返是一种以空间换时间的思想,毕竟中间结果集要多占用一倍的空间(至少)。 
阅读(322) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~