Linux 下的 iconv 命令可以来处理字符编码的转换,没有就用 piconv;基本命令格式如下:
iconv -f 原始编码 -t 目标编码 文件名 > 新文件名 -f 代表 from,-t 代表 to。 假设我要把 text.txt 从 GB2312 编码转换成 UTF-8,并且保存为 text-utf-8.txt 的话,那么命令如下: iconv -f GB2312 -t utf-8 text.txt > text-utf-8.txt 不过有的时候,转换会报错,很可能的原因是原文件中有些字符超过了 GB2312 的范围,那么,这个时候,我们可以把 GB2312 改成它的超集 GB18030,一般就解决问题了: iconv -f gb18030 -t utf-8 text.txt > text-utf-8.txt
阅读(674) | 评论(0) | 转发(0) |