Chinaunix首页 | 论坛 | 博客
  • 博客访问: 489092
  • 博文数量: 127
  • 博客积分: 7010
  • 博客等级: 少将
  • 技术积分: 1972
  • 用 户 组: 普通用户
  • 注册时间: 2006-12-01 12:42
文章分类

全部博文(127)

文章存档

2009年(33)

2008年(94)

我的朋友

分类: LINUX

2009-03-31 10:08:47

一、LWP::Simple 模块  获取代码:
#!/usr/bin/perl
use strict;
use warnings;
use LWP::Simple;
my $url="";
my $page=get ($url);
print ("\n $page \n \n");
my $status=getprint($url);
print ("\n\n $status\n");
$status=getstore($url,"page.txt");
print ("\n $status \n");
 
 
 
 
二、HTML解析:  HTML::TokeParser模块 
 
 
#!/usr/bin/perl
  2 use strict;
  3 use warnings;
  4 use LWP::UserAgent;
  5 use HTML::TokeParser;
  6 my $url="";
  7 my $agent=new LWP::UserAgent();
  8 my $request=new HTTP::Request('GET'=>$url);
  9 my $response=$agent->request($request);
 10 my $document=$response->content();
 11
 12 my $page=HTML::TokeParser->new (\$document);
 13 while (my $token=$page->get_token()){
 14     my $type=shift(@{$token});
 15     my $text=shift(@{$token});
 16     if ($type eq "T"){
 17         print ("$text");
 18     }
 19 }
 
 
 
阅读(1348) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~