Chinaunix首页 | 论坛 | 博客
  • 博客访问: 62660
  • 博文数量: 114
  • 博客积分: 0
  • 博客等级: 民兵
  • 技术积分: 5
  • 用 户 组: 普通用户
  • 注册时间: 2015-02-26 16:03
文章分类

全部博文(114)

文章存档

2015年(114)

我的朋友

分类: LINUX

2015-02-26 16:36:36

 

1.字符集:

汉字编码:

* GB2312字集是简体字集,全称为GB2312(80)字集,共包括国标简体汉字6763个。 * BIG5字集是台湾繁体字集,共包括国标繁体汉字13053个。 * GBK字集是简繁字集,包括了GB字集、BIG5字集和一些符号,共包括21003个字符。 * GB18030是国家制定的一个强制性大字集标准,全称为GB18030-2000,它的推出使汉字集有了一个大一统的标准。

ASCII码:

American Standard Code for Information Interchange,美国信息交换标准码。 目前计算机中用得最广泛的字符集及其编码,由美国国家标准局(ANSI)制定。它已被国际标准化组织(ISO)定为国际标准,称为ISO 646标准。 ASCII字符集由控制字符和图形字符组成。 在计算机的存储单元中,一个ASCII码值占一个字节(8个二进制位),其最高位(b7)用作奇偶校验位。 所谓奇偶校验,是指在代码传送过程中用来检验是否出现错误的一种方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码一个字节中1的个数必须是奇数,若非奇数,则在最高位b71。 偶校验规定:正确的代码一个字节中1的个数必须是偶数,若非偶数,则在最高位b71

UTF

Unicode 的实现方式不同于编码方式。 一个字符的Unicode编码是确定的,但是在实际传输过程中,由于不同系统平台的设计不一定一致,以及出于节省空间的目的,对Unicode编码的实现方式有所不同。 Unicode的实现方式称为Unicode转换格式(Unicode Translation Format,简称为 UTF) * UTF-8: 8bit变长编码,对于大多数常用字符集(ASCII0~127字符)它只使用单字节,而对其它常用字符(特别是朝鲜和汉语会意文字),它使用3字节。 * UTF-16: 16bit编码,是变长码,大致相当于20位编码,值在00x10FFFF之间,基本上就是unicode编码的实现,与CPU字序有关。

2.解决办法:

乱码分两种情况:

(1) 终端(shell界面)的乱码

 在/etc/profile文件的最后一行添加如下内容:

  export LC_ALL="zh_CN.GB18030"

vi /etc/profile

export LC_ALL="zh_CN.GB18030:zh_CN.GB2312:zh_CN.GBK:zh_CN:en_US.UTF-8:en_US:en:zh:zh_TW:zh_CN.BIG5"

保存退出,reboot系统即可..

 

(2) X-window(图形界面)的乱码

/etc/sysconfig/i18n文件的最后一行添加如下内容:

  export LC_ALL="zh_CN.GB18030"

vi /etc/sysconfig/i18n

LANG="zh_CN.GB18030:zh_CN.GB2312:zh_CN.GBK:zh_CN:en_US.UTF-8:en_US:en:zh:zh_TW:zh_CN.BIG5"

LANGUAGE="zh_CN.GB18030:zh_CN.GB2312:zh_CN.GBK:zh_CN:en_US.UTF-8:en_US:en:zh:zh_TW:zh_CN.BIG5"

保存reboot即可...

 

阅读(183) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~