初学者遇到的PostgreSQL字符集问题的解决-osdba-ChinaUnix博客

^_^ osdba ^_^

首页　| 　博文目录　| 　关于我

osdba

博客访问： 858179
博文数量： 150
博客积分： 5123
博客等级：大校
技术积分： 1478
用户组：普通用户
注册时间： 2008-11-06 10:03

文章分类

全部博文（150）

硬件（1）
NoSQL及嵌入式数（15）
分布式文件系统（2）
Linux内核学习（0）
Oracle（37）

troubleshoot（13）
算法（4）
程序开发（22）

libevent（4）

socket（10）
方法与技巧（6）
网络（3）
压力测试（0）
thinking（1）
PostgreSQL（32）

plproxy（6）

PITR（2）

slony（2）

10.PostgreSQL开（3）

05.高可用（1）

04.问题处理（2）

03.调优（5）

01.入门（5）

02.日常管理（6）
新技术（5）
虚拟机（2）
Linux（10）
MySQL（9）
AIX（0）
未分配的博文（1）

文章存档

2011年（2）

2010年（139）

2009年（9）

我的朋友

最近访客

推荐博文

初学者遇到的PostgreSQL字符集问题的解决

分类：

2010-04-05 23:22:43

当初学者在使用PostgreSQL数据库，输入中文时，会遇到“ERROR: invalid byte sequence for encoding "UTF8": 0xd6d0”的错误，原因是由于没有正确设置客户端字符集。

问题的原因：

默认情况下，PostgreSQL是不转换字符集的，如果你的数据库是UTF8的字符集，一般终端的中文字符集会设置为GBK，或en_US（查看终端的字符集可以看LANG环境变量的设置），所以你输入的中文是GBK的编码，这个编码不经转换的存入数据库中，而数据库是UTF8的，PostgreSQL一看没有这样的UTF8编码，所以当然报错了。

解决方法为：

方法一：设置postgresql的客户端编码为GBK，这时PostgreSQL就知道输入的内容是GBK编码的，这样PostgreSQL数据库会自动做字符集的转换，把其转换成UTF8编码。

方法二：直接设置终端的字符集编码为UTF8，让输入的编码直接为UTF8，而不是GBK。

看我具体的演示：

方法一：设置postgresql的客户端编码：

设置psql客户端字符集为GBK，方法有两种，一种是在psql中输入“\encoding GBK” ，另一种是设置环境变量“export PGCLIENTENCODING=GBK”，看我的演示：
#psql -d dsc
dsc=# insert into t values(1,'中国');
ERROR: invalid byte sequence for encoding "UTF8": 0xd6d0
HINT: This error can also happen if the byte sequence does not match the encoding expected by the server, which is controlled by "client_encoding".
dsc=# show client_encoding;
client_encoding
-----------------
UTF8
(1 row)

dsc=# \encoding GBK
dsc=# show client_encoding;
client_encoding
-----------------
GBK
(1 row)

dsc=# insert into t values(1,'中国');
INSERT 0 1
dsc=# commit;
WARNING: there is no transaction in progress
COMMIT
dsc=# select * from t;
id | name
----+------
1 | 中国
(1 row)

[postgres@dsc ~]$ export PGCLIENTENCODING=GBK
[postgres@dsc ~]$ psql
psql: FATAL: conversion between GBK and LATIN1 is not supported
[postgres@dsc ~]$ psql -d dsc
psql (8.4.3)
Type "help" for help.

dsc=# select * from t;
id | name
----+------
1 | 中国
(1 row)

dsc=# insert into t values(2,'我的中国');
INSERT 0 1
dsc=# select * from t;
id | name
----+----------
1 | 中国
2 | 我的中国
(2 rows)

方法二：设置终端的编码为UTF8：

[postgres@dsc ~]$ export LANG=zh_CN.UTF8

然后修改终端软件的字符集编码，我使用的是SecureCRT，修改方法为：

Option->Session Option->外观->字符编码，把那个下拉框的内容改成“UTF8”: