Ubuntu默认采用UTF8编码,可以方便global。但对中文支持,还不细致,即便默认采用中文安装,也并不会自动添加GB*等支持,致使在Ubuntu下访问部分Win文本文件时,出现乱码。
I.配置系统环境
执行sudovi/var/lib/locales/supported.d/zh
加入以下配置参数
zh_CN.GB18030GB18030(最新汉字编码字符集,向下兼容GBK,GB2312)
zh_CN.GBKGBK(汉字扩展编码,向下兼容GB2312,并包含BIG5全部汉字)
zh_CN.GB2312GB2312(简化汉字编码字符集,最近有客户要我们改进GB2312,太看得起我们了,我只能说:"NO!")
zh_CN.GB18031GB18031(数字键盘汉字编码输入,面向手持设备,我的Nokia3120从来就是发短信,接听电话,无法和PC通讯,就不用这个了。maybe用GoogleAndroidSDK的大侠们需要这个)
zh_HK.BIG5BIG5(繁体)
zh_TW.BIG5BIG5(繁体)
然后执行sudolocale-gen
提示以下信息,成功了
zh_CN.GB18030...done
zh_CN.GBK...done
......
II.系统环境支持GB*内码了,但用vi,gedit等工具访问文件还会继续乱码,需要针对不同的工具分别配置,使之自己检测支持范围内的编码
e.g.vi
执行sudovi/etc/vim/vimrc
加入以下配置参数
let&termencoding=&encoding
setfileencodings=utf-8,gb18030,gbk,gb2312,big5
e.g.gedit
执行sudogconf-editor
选择apps/gedit-2/preferences/encodings
找到auto_detected编辑,在Values中分别加入GB18030,GBK,GB2312,BIG5
OK~
感谢lec的支援。
enca工具很方便,用于检测文件内码(前提是系统环境支持,如,环境不支持BIG5,是无法检测的,这个晕了我许久)
安装sudoapt-getinstallenca
用法encafilename
这个工具是在google搜索到的(http://blog.oolec.com/?p=79),绕了地球一圈才找到,猛发现文章作者就坐在我旁边,以后再找东西先问问,别瞎跑。
下载本文示例代码
阅读(273) | 评论(0) | 转发(0) |