Chinaunix首页 | 论坛 | 博客
  • 博客访问: 473603
  • 博文数量: 107
  • 博客积分: 6073
  • 博客等级: 准将
  • 技术积分: 790
  • 用 户 组: 普通用户
  • 注册时间: 2009-08-14 15:34
文章分类

全部博文(107)

文章存档

2010年(1)

2009年(106)

分类: LINUX

2009-10-06 23:24:08

作者:wangxinus,
来源:http://wangxinus.cublog.cn
说明:
原创文章欢迎转载,交流请Email给作者

有时候需要把GBK编码的文件转换到UTF-8编码,这样的软件在网上也好找。但是以前遇到的一些编码,比如泰文的,越南文的,日文,韩文等等,想转换成Unicode的编码,就不好找到这样的软件了。

遇到问题总是要解决的。接触Linux以前,很多GNU的工具我都几乎没有概念,这也是我自从接触Linux以后,最大的收获之一。

以前我采用的方法,就是把这样的文本文件用IE打开,IE支持的编码很多很多,比如泰文的,我们打开的时候是乱码,然后再IE上面点右键,选择编码为泰文的,OK,显示就正常了。如何保存成UTF-8编码的呢?点击IE的另存为,呵呵。可以自己选择编码,选UTF-8的就OK了。

IE在这方面的确很强大。。。

好了,说说iconv。iconv一般在linux的发行版本中就有吧!没有也可以下,百度一下吧。

用法,比如我有一个文件 jpn.txt 的日文SHIFT-JIS编码的文件。

#iconv -f SHIFT-JIS -t UTF-8 jpn.txt > newJpn.txt

这样,我们就能把jpn.txt转换成UTF-8编码,并另存为 newJpn.txt 文件中了。

-f : from 表示来自什么编码
-t : to 表示转换的目标编码
> : linux的重定位符号,不然直接在终端输出结果了。
SHIFT-JIS , UTF-8 : 这些都是iconv支持的字符集,更多可以参考iconv的说明

#man 3 iconv_open
我用过 man iconv 里面竟然没有说明。。。。
iconv_open是libiconv提供的函数,可以自己编程用的。
阅读(2124) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~