Chinaunix首页 | 论坛 | 博客
  • 博客访问: 124423
  • 博文数量: 14
  • 博客积分: 2000
  • 博客等级: 大尉
  • 技术积分: 540
  • 用 户 组: 普通用户
  • 注册时间: 2007-11-01 23:42
文章分类

全部博文(14)

文章存档

2011年(1)

2008年(13)

我的朋友

分类:

2008-05-20 20:58:25

偶然在处理文件的时候,碰到某些中文文件,需要对这些文件进行处理

文件使用的是UTF8编码,直接用中文进行匹配出现问题,

后来使用了Encode模块


#!/usr/bin/perl -w
use strict;
use Encode;
@tmp=split [-$re]/,Encode::decode('utf8',@temp[$index-1]);
$hostname=Encode::encode('utf-8',@tmp[-1]);


上面代码为不完整代码,可以进行纯中文的匹配了

后来发现在匹配中文字符的括号时还是不能胜任,估计匹配其它符号也会出问题

百思不得其解,后来在老大的指点下,使用了GBK编码,问题解决

GBK编码和UTF8编码除了字节上的不同之外,其它的其它有空再看下相关文档研究一下
阅读(2661) | 评论(1) | 转发(0) |
给主人留下些什么吧!~~

chinaunix网友2008-09-17 10:46:08

可能是编辑器默认编码问题吧:)