Chinaunix首页 | 论坛 | 博客
  • 博客访问: 157552
  • 博文数量: 56
  • 博客积分: 2510
  • 博客等级: 少校
  • 技术积分: 502
  • 用 户 组: 普通用户
  • 注册时间: 2009-12-18 14:21
文章分类

全部博文(56)

文章存档

2010年(39)

2009年(17)

我的朋友

分类:

2009-12-20 20:51:32


测试数据:url_list.txt
=

#!/bin/perl

use strict;
use Encode;

open URL_FILE,"<$ARGV[0]" or die "use perl url_keyword_get.pl url_list.txt ,$!";
#print $ARGV[0];


open(FILE, ">key_word.txt");
#binmode FILE;



while(my $line = <URL_FILE>)
{
# print $line;


# $line =~ s/%([a-fA-F0-9][a-fA-F0-9])/pack("C",hex($1))/eg;


 my $key_word;
 if($line =~ /google/)
 {
     $line =~ m/q=(.*?)&/; #"?"表示非贪婪匹配


     $key_word = $1;
     $key_word =~ s/\+/" "/eg;
        $key_word=~ s/%([a-fA-F0-9][a-fA-F0-9])/pack("C",hex($1))/eg;#关键的替换操作

     print FILE $key_word,"\n";
     print $key_word,"\n";
 }
 elsif($line =~ /baidu/)
 {
     $line =~ m/wd=(.*?)&/; #"?"表示非贪婪匹配


     $key_word = $1;
     $key_word =~ s/\+/" "/eg;
        $key_word=~ s/%([a-fA-F0-9][a-fA-F0-9])/pack("C",hex($1))/eg;
     $key_word = Encode::decode("gb2312", $key_word);
  print FILE $key_word,"\n";
  print $key_word,"\n";
 }
}
close FILE;
close URL_FILE;

#以下是注释掉的程序,没有用到


=pod #perl 中的段注释


 my @array;
 @array = split(/%/,$line);
 print join(",",@array);
 my $i = 1;
 while($i < @array )
 {
   $array[$i]= hex($array[$i]);
   my $data = pack("C1",$array[$i]);
   print $data,"\n";
   print FILE $data;
   $i = $i + 1;
 }
=cut


阅读(759) | 评论(0) | 转发(0) |
0

上一篇:至理名言

下一篇:swf格式简单分析

给主人留下些什么吧!~~