2011年(10)
分类: Python/Ruby
2011-09-02 22:09:40
use LWP::Simple;
use utf8;
use Encode;
open F,'>d:/bc.html';
$content = get("");
#Encode::_utf8_on($content);
$content=encode('gb2312',$content);
die "Couldn't get it!" unless defined $content;
print F $content;
#print 'complete';
close F;
以上代码去网页下载网页文件,然后写入文件中,
抓取网页使用了LWP::Simple
字符串编码使用了Encode模块的encode方法,若不进行转码则会乱码