perl中文正则匹配-stutiredboy-ChinaUnix博客

文章分类

文章存档

2008年（13）

我的朋友

最近访客

推荐博文

perl中文正则匹配

分类：

2008-05-20 20:58:25

偶然在处理文件的时候，碰到某些中文文件，需要对这些文件进行处理

文件使用的是UTF8编码，直接用中文进行匹配出现问题，

后来使用了Encode模块

＃！/usr/bin/perl -w use strict; use Encode; @tmp=split [-$re]/,Encode::decode('utf8',@temp[$index-1]); $hostname=Encode::encode('utf-8',@tmp[-1]);

上面代码为不完整代码，可以进行纯中文的匹配了

后来发现在匹配中文字符的括号时还是不能胜任，估计匹配其它符号也会出问题

百思不得其解，后来在老大的指点下，使用了GBK编码，问题解决

GBK编码和UTF8编码除了字节上的不同之外，其它的其它有空再看下相关文档研究一下

阅读(2661) | 评论(1) | 转发(0) |

给主人留下些什么吧！~~

chinaunix网友2008-09-17 10:46:08

可能是编辑器默认编码问题吧：）

感谢所有关心和支持过ChinaUnix的朋友们