Chinaunix首页 | 论坛 | 博客
  • 博客访问: 1572133
  • 博文数量: 50
  • 博客积分: 9971
  • 博客等级: 中将
  • 技术积分: 2615
  • 用 户 组: 普通用户
  • 注册时间: 2006-01-03 16:03
文章分类

全部博文(50)

文章存档

2011年(2)

2010年(2)

2009年(41)

2008年(5)

我的朋友

分类:

2009-04-29 17:10:16



此函数用于截取gb2312编码的中文字符串:

PHP:
  1.  
  2. // 说明:截取中文字符串
  3. // 整理:
  4.  
  5. function mysubstr($str, $start, $len) {
  6. $tmpstr = "";
  7. $strlen = $start + $len;
  8. for($i = 0; $i < $strlen; $i++) {
  9. if(ord(substr($str, $i, 1)) > 0xa0) {
  10. $tmpstr .= substr($str, $i, 2);
  11. $i++;
  12. } else
  13. $tmpstr .= substr($str, $i, 1);
  14. }
  15. return $tmpstr;
  16. }
  17. ?>
此函数用于截取utf8编码的多字节字符串:



PHP:
  1.  
  2. // 说明:截取utf8字符串
  3. // 整理:
  4.  
  5. function utf8Substr($str, $from, $len)
  6. {
  7. return preg_replace('#^(?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$from.'}'.
  8. '((?:[\x00-\x7F]|[\xC0-\xFF][\x80-\xBF]+){0,'.$len.'}).*#s',
  9. '$1',$str);
  10. }
  11. ?>
Utf-8、gb2312都支持的汉字截取函数
代码:

PHP:
  1.  
  2. // 说明:Utf-8、gb2312都支持的汉字截取函数
  3. // 整理:
  4.  
  5. /*
  6. Utf-8、gb2312都支持的汉字截取函数
  7. cut_str(字符串, 截取长度, 开始长度, 编码);
  8. 编码默认为 utf-8
  9. 开始长度默认为 0
  10. */
  11.  
  12. function cut_str($string, $sublen, $start = 0, $code = 'UTF-8')
  13. {
  14. if($code == 'UTF-8')
  15. {
  16. $pa = "/[\x01-\x7f]|[\xc2-\xdf][\x80-\xbf]|\xe0[\xa0-\xbf][\x80-\xbf]|[\xe1-\xef][\x80-\xbf][\x80-\xbf]|\xf0[\x90-\xbf][\x80-\xbf][\x80-\xbf]|[\xf1-\xf7][\x80-\xbf][\x80-\xbf][\x80-\xbf]/";
  17. preg_match_all($pa, $string, $t_string);
  18.  
  19. if(count($t_string[0]) - $start > $sublen) return join('', array_slice($t_string[0], $start, $sublen))."...";
  20. return join('', array_slice($t_string[0], $start, $sublen));
  21. }
  22. else
  23. {
  24. $start = $start*2;
  25. $sublen = $sublen*2;
  26. $strlen = strlen($string);
  27. $tmpstr = '';
  28.  
  29. for($i=0; $i<$strlen; $i++)
  30. {
  31. if($i>=$start && $i<($start+$sublen))
  32. {
  33. if(ord(substr($string, $i, 1))>129)
  34. {
  35. $tmpstr.= substr($string, $i, 2);
  36. }
  37. else
  38. {
  39. $tmpstr.= substr($string, $i, 1);
  40. }
  41. }
  42. if(ord(substr($string, $i, 1))>129) $i++;
  43. }
  44. if(strlen($tmpstr)<$strlen ) $tmpstr.= "...";
  45. return $tmpstr;
  46. }
  47. }
  48.  
  49. $str = "abcd需要截取的字符串";
  50. echo cut_str($str, 8, 0, 'gb2312');
  51. ?>
  52.  
摘录自 BugFree 的字符截取函数
本函数摘录自 BugFree,支持字母和gb2312或者utf-8混和字符串。





PHP:
  1.  
  2. // 说明:摘录自 BugFree 的字符截取函数
  3. // 整理:
  4.  
  5. /**
  6. * @package BugFree
  7. * @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $
  8. *
  9. *
  10. * Return part of a string(Enhance the function substr())
  11. *
  12. * @author Chunsheng Wang
  13. * @param string $String the string to cut.
  14. * @param int $Length the length of returned string.
  15. * @param booble $Append whether append "...": false|true
  16. * @return string the cutted string.
  17. */
  18. function sysSubStr($String,$Length,$Append = false)
  19. {
  20. if (strlen($String) <= $Length )
  21. {
  22. return $String;
  23. }
  24. else
  25. {
  26. $I = 0;
  27. while ($I < $Length)
  28. {
  29. $StringTMP = substr($String,$I,1);
  30. if ( ord($StringTMP) >=224 )
  31. {
  32. $StringTMP = substr($String,$I,3);
  33. $I = $I + 3;
  34. }
  35. elseif( ord($StringTMP) >=192 )
  36. {
  37. $StringTMP = substr($String,$I,2);
  38. $I = $I + 2;
  39. }
  40. else
  41. {
  42. $I = $I + 1;
  43. }
  44. $StringLast[] = $StringTMP;
  45. }
  46. $StringLast = implode("",$StringLast);
  47. if($Append)
  48. {
  49. $StringLast .= "...";
  50. }
  51. return $StringLast;
  52. }
  53. }
  54.  
  55. $String = "CodeBit.cn -- 简单、精彩、通用";
  56. $Length = "18";
  57. $Append = false;
  58. echo sysSubStr($String,$Length,$Append);
  59. ?>





阅读(908) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~