Chinaunix首页 | 论坛 | 博客
  • 博客访问: 134587
  • 博文数量: 73
  • 博客积分: 1400
  • 博客等级: 上尉
  • 技术积分: 760
  • 用 户 组: 普通用户
  • 注册时间: 2008-01-29 14:07
文章分类
文章存档

2011年(2)

2010年(4)

2009年(40)

2008年(27)

我的朋友

分类:

2008-12-24 09:51:36

 

一个脚本用于分析应用程序的日志,但是在这些日志文件中,有的编码是utf-8的,有的编码是gbk的.对于utf-8的日志文件,需要将内容转换成gbk的编码,这样看到的中文才不至于乱码:

因此,在perl脚本中加入以下行判断日志内容,如是不是gbk的编码,就对其转码:

$line=encode ("gbk",decode("utf-8",$line)) unless (detect($line) =~ /gb/);

这里用到的模块有:

use Encode;

use Encode::CN;

use Encode::Detect::Detector;

阅读(974) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~