Chinaunix首页 | 论坛 | 博客
  • 博客访问: 258646
  • 博文数量: 54
  • 博客积分: 2915
  • 博客等级: 少校
  • 技术积分: 486
  • 用 户 组: 普通用户
  • 注册时间: 2009-05-21 12:20
个人简介

这个人很懒,什么都没有留下

文章分类
文章存档

2013年(1)

2012年(6)

2011年(11)

2010年(16)

2009年(20)

我的朋友

分类:

2009-05-21 14:20:43

曾遇到的问题:

用LWP::Simple获取goole主页( )的网页代码跟直接用浏览器获取的页面源代码不一样。

 

解决:

经各种搜索,得知设置agent就可以了。于是,改用LWP::UserAgent来获取网页代码。结果成功了。在这里可以设置agent来模拟一个浏览器,例如模拟一个firefox浏览器:

   my $browser=LWP::UserAgent->new;

   $browser->agent("Mozilla/5.0 (X11; U; Linux i686; en-US; rv:1.9.0.4)Gecko/2008111217 Fedora/3.0.4-1.fc10 Firefox/3.0.4");

 

解释:

经过和同学们讨论,一种解释如下。LWP::Simple不支持cookies,于是在获取google主页的源代码时自动忽略了某些代码。而用LWP::UserAgent模拟浏览器后就可以支持了。

阅读(2489) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~