Chinaunix首页 | 论坛 | 博客
  • 博客访问: 103800
  • 博文数量: 35
  • 博客积分: 2386
  • 博客等级: 大尉
  • 技术积分: 380
  • 用 户 组: 普通用户
  • 注册时间: 2009-05-05 06:11
文章分类

全部博文(35)

文章存档

2011年(1)

2010年(2)

2009年(32)

分类: C/C++

2009-07-19 19:47:24

    字符串无非就是字符的序列,范围从0~255。不同的是一般的ASCII字符串只使用了前128个,而使用GB、Big5编码的字符串使用了128~255范围内的字符。以GB和Big5为例,它们一般并没有使用128~255范围内全部的字符,只是使用了部分,这样才为字符集的判断提供了可能性。如果一个字符串可以将它的字符集范围缩小在GB和Big5两者之一,假如字符串内包含GB没有使用的字符,而这个字符是Big5中使用的,那么这个字符串编码就是Big5,反之就是GB

    如果字符串很短,而且都在GB和Big5重叠的那个范围内,就无法判断了。非常完善精确的判断是不可能的

阅读(413) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~