Linux下从GB2312到UTF-8的转换-badb0y-ChinaUnix博客

好想好好爱你！badb0y.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

badb0y

博客访问： 7791709
博文数量： 1780
博客积分： 18684
博客等级：上将
技术积分： 16442
用户组：普通用户
注册时间： 2010-06-02 10:28

个人简介

啥也没写

文章分类

全部博文（1780）

手记（15）
休闲无聊（104）
UNIX（1426）

code（170）

linux bsd（1199）

MAC X（7）

Solaris（22）

Tru64 OpenVMS（4）

AS400（9）

AIX（11）

HP-UX（3）
网络技术（46）
小工具（22）
服务器技术（146）
未分配的博文（21）

文章存档

2025年（10）

2024年（16）

2023年（44）

2022年（39）

2021年（46）

2020年（43）

2019年（27）

2018年（44）

2017年（50）

2016年（47）

2015年（15）

2014年（21）

2013年（43）

2012年（143）

2011年（228）

2010年（263）

2009年（384）

2008年（246）

2007年（30）

2006年（38）

2005年（2）

2004年（1）

我的朋友

相关博文

Linux下从GB2312到UTF-8的转换

分类： LINUX

2010-04-28 22:24:32

UTF-8 这种编码已经是大势所趋，但是还有不少中文的文档保留着老式的 GB2312编码，而且只要你要和 Windows 打交道，就免不了要处理 GB2312 的问题，比如处理从 Windows 下拷过来的程序源代码、文本文件、字母文件之类。

编码转换的方法估计大多数同学都知道了，不过还是有必要再强调一下，我就是老忘。

Linux 下的 iconv 命令可以来处理字符编码的转换，基本命令格式如下：

iconv -f 原始编码 -t 目标编码文件名 > 新文件名

-f 代表 from，-t 代表 to。

假设我要把 text.txt 从 GB2312 编码转换成 UTF-8，并且保存为 text-utf-8.txt 的话，那么命令如下：

iconv -f GB2312 -t utf-8 text.txt > text-utf-8.txt

不过有的时候，转换会报错，很可能的原因是原文件中有些字符超过了 GB2312 的范围，那么，这个时候，我们可以把 GB2312 改成它的超集 GB18030，一般就解决问题了：

iconv -f gb18030 -t utf-8 text.txt > text-utf-8.txt

阅读(1651) | 评论(1) | 转发(1) |

上一篇：在美国VPS上安装nginx+php

下一篇：iprober PHP探针 v0.024

给主人留下些什么吧！~~

chinaunix网友2010-05-03 16:09:53

我想有时候需要-c参数。

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6