Chinaunix首页 | 论坛 | 博客
  • 博客访问: 103725237
  • 博文数量: 19283
  • 博客积分: 9968
  • 博客等级: 上将
  • 技术积分: 196062
  • 用 户 组: 普通用户
  • 注册时间: 2007-02-07 14:28
文章分类

全部博文(19283)

文章存档

2011年(1)

2009年(125)

2008年(19094)

2007年(63)

分类: LINUX

2008-04-22 12:52:04

作者: Brook  出自:
初学者可能没在意过这个问题,但是你一但深入点,尤其当在纯字符界面下使用时,就会为字符集问题苦恼,我查了很多网站,稍微总结一下

我们会遇到的情况
1、字符界面下无法识别输入中文
你肯定知道安装zhcon就可以解决这个问题,但是安装完了以后那些命令,你知道如何输入吗?如果直接输入zhcon后,你会发现系统识别不了以前的中文的文件名和内容,而此时如果你新建一个中文的文件或者输入中文的内容,在桌面系统下也识别不了。
2、浏览网页时,出现了乱码
3、你用过FTP吗,你在桌面系统下将中文文件放到FTP的文件夹下,你发现别人访问你的FTP时,里面全是乱码

其实上面两个问题都是关于字符集的问题,它们的字符集不同
1、windows、linux桌面系统下,默认的中文字符集是UTF8,而浏览器、zhcon默认的字符集是GB2312,所以它们互相识别不了。如果你在浏览器里面的“查看”,选择UTF8编码,就可以识别这些了.当然zhcon也是这样,如果你输入zhcon --utf8 就不会遇到上面的问题了
2、现在就说说到底字符集都有哪些
windows、linux默认的中文字符集是UTF8(它是Unicode的一部分,适用于中日韩文),我们国内的有(从字符集大小排)依次有GB2312->GB18030->GBK,简单介绍如下
GB2312=ASCII+扩展的ASCII字符+常用汉字
GB18030=GB2312+特殊字符
GBK=GB18030+所有其它字符(这个不太了解了)
当然这三个字符集后者是兼容前者的,可以互相识别,但是UTF8与它们就不认识了。
我们国内的一些软件用的基本都是GB2312,所以如果你开发软件时一定要注意字符集问题
如果你了解上述知识,相信以后你遇到这类问题就知道如何解决了,自己装g2ipmsg时就遇到这个问题,不过修改了一些文件就可以了。
阅读(211) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~