Chinaunix首页 | 论坛 | 博客
  • 博客访问: 460550
  • 博文数量: 141
  • 博客积分: 211
  • 博客等级: 入伍新兵
  • 技术积分: 1049
  • 用 户 组: 普通用户
  • 注册时间: 2010-09-17 16:25
个人简介

如此经年,望尽千帆。

文章分类

全部博文(141)

文章存档

2014年(73)

2013年(65)

2012年(3)

我的朋友

分类: PHP

2014-04-08 07:12:07

php中怎么用匹配中文,需要注意什么?

在中汉字正则可能有些朋友觉得很简单,但是在使用时会发现在gbk编码与uft8可能会有点区别哦。
gbk编码下汉字正则

1.判断字符串是否全是汉字

  1.     $str = '全部是汉字测试';  
  2.     if (preg_match_all("/^([x81-xfe][x40-xfe])+$/"$str$match)) {  
  3.         echo '全部是汉字';    
  4.     } else {  
  5.         echo '不全是汉字';  
  6.     }  
  7. ?>   

当$str = '全部是汉字测试'; 时输出"全部是汉字";
当$str = 'all全部是汉字测试'; 时输出"不全是汉字";

2.判断字符串是否包含汉字

  1.     $str = '汉字3测试';  
  2.     if (preg_match("/([x81-xfe][x40-xfe])/"$str$match)) {  
  3.         echo '含有汉字';    
  4.     } else {  
  5.         echo '不含有汉字';  
  6.     } //   
  7. ?>   

当$str = '汉字3测试'; 时输出"含有汉字";
当$str = 'abc345'; 时输出"不含有汉字";
上述变量$str的内容与utf8还是gbk编码无关,判断结果是一样的。
utf-8编码下用正则表达式如何匹配汉字
  1. $str = "php编程";   
  2. if (preg_match("/^[x{4e00}-x{9fa5}]+$/u",$str)) {   
  3. print("该字符串全部是中文");   
  4. else {   
  5. print("该字符串不全部是中文");   
阅读(859) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~