字符串无非就是字符的序列,范围从0~255。不同的是一般的ASCII字符串只使用了前128个,而使用GB、Big5编码的字符串使用了128~255范围内的字符。以GB和Big5为例,它们一般并没有使用128~255范围内全部的字符,只是使用了部分,这样才为字符集的判断提供了可能性。如果一个字符串可以将它的字符集范围缩小在GB和Big5两者之一,假如字符串内包含GB没有使用的字符,而这个字符是Big5中使用的,那么这个字符串编码就是Big5,反之就是GB
如果字符串很短,而且都在GB和Big5重叠的那个范围内,就无法判断了。非常完善精确的判断是不可能的
阅读(1142) | 评论(0) | 转发(0) |