Chinaunix首页 | 论坛 | 博客
  • 博客访问: 808672
  • 博文数量: 296
  • 博客积分: 5376
  • 博客等级: 大校
  • 技术积分: 2298
  • 用 户 组: 普通用户
  • 注册时间: 2009-03-14 19:02
文章分类

全部博文(296)

文章存档

2023年(2)

2020年(2)

2018年(2)

2017年(26)

2016年(4)

2015年(19)

2014年(12)

2013年(26)

2012年(84)

2011年(50)

2010年(41)

2009年(28)

分类:

2009-06-14 04:20:36

在ANSI格式下,汉字一般由两个字节组成
可使用如下方式匹配
([\x80-\xFF]+)
 
while(){
    my $testline=$_;  
    ### $testline;
    if($testline =~ /([\x80-\xFF]{4}).*/i){ 
        ### found :$1;
    }
}
__DATA__
怎样用正则表达式匹配汉字
 
结果为:
### $testline: '怎样用正则表达式匹配汉字'
### found : '怎样'
 
阅读(1623) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~