分类: Python/Ruby
2012-06-20 12:59:46
首先要知道perl只能处理两种编码:ascii码和utf-8,ascii码是很少的,像中文、日文、韩文等字符要想能被perl处理,只能用 utf-8编码方式。网页内容读入后用decode处理一下,在print出去之前再用encode处理一下,就可以了。decode即解码成perl能处理的utf-8编码,encode则编码成输出终端能支持的编码,比如GBK。
my $out = encode(“GBK”, $res->decoded_content());
或者
my $out = encode(“GBK”, decode(“utf-8”, $html->content()));