Chinaunix首页 | 论坛 | 博客
  • 博客访问: 30216333
  • 博文数量: 2065
  • 博客积分: 10377
  • 博客等级: 上将
  • 技术积分: 21525
  • 用 户 组: 普通用户
  • 注册时间: 2008-11-04 17:50
文章分类

全部博文(2065)

文章存档

2012年(2)

2011年(19)

2010年(1160)

2009年(969)

2008年(153)

分类: Mysql/postgreSQL

2010-01-27 14:29:35

Mysql查看编码方式专题

一、查看数据库的字符集

show variables like 'character\_set\_%';

输出:

+--------------------------+--------+

| Variable_name            | Value  |

+--------------------------+--------+

| character_set_client     | latin1 |

| character_set_connection | latin1 |

| character_set_database   | latin1 |

| character_set_filesystem | binary |

| character_set_results    | latin1 |

| character_set_server     | latin1 |

| character_set_system     | utf8   |

+--------------------------+--------+

结合以下的编码表我们发现当前的数据库系统的编码:

latin1_bin  

西欧 (多语言), 二进制  

 

binary  

二进制  

 

以上是我在linux环境中的查看的结果编码集了。我现在WIN平台上面查看编码集结果如:

+--------------------------+--------+

| Variable_name            | Value  |

+--------------------------+--------+

| character_set_client     | utf8   |

| character_set_connection | utf8   |

| character_set_database   | utf8   |

| character_set_filesystem | binary |

| character_set_results    | utf8   |

| character_set_server     | utf8   |

| character_set_system     | utf8   |

+--------------------------+--------+

为什么会出现不一致的情况呢?在我本机上面是显示的UTF-8.而在LINUX上面居然是

 

二、通过命令修改其编码

创建数据库指定数据库的字符集

mysql>create database mydb character set utf-8;#直接指定其编码

直接通过命令进行修改

set character_set_client=utf8;

set character_set_connection=utf8;

set character_set_database=utf8;

set character_set_results=utf8;

set character_set_server=utf8;

修改完了之后再查询

show variables like 'character\_set\_%';

+--------------------------+--------+

| Variable_name            | Value  |

+--------------------------+--------+

| character_set_client     | utf8   |

| character_set_connection | utf8   |

| character_set_database   | utf8   |

| character_set_filesystem | binary |

| character_set_results    | utf8   |

| character_set_server     | utf8   |

| character_set_system     | utf8   |

+--------------------------+--------+

结果全部都调整修改成UTF-8了!

修改完了之后我看 select * from address_address; 出现乱码了!Django也乱码

 

三、解决数据导入导出的乱码问题

#create database nginxdjango;

# use nginxdjango;

# show variables like 'character\_set\_%';

#打印输出居然是如下

+--------------------------+--------+

| Variable_name            | Value  |

+--------------------------+--------+

| character_set_client     | latin1 |

| character_set_connection | latin1 |

| character_set_database   | latin1 |

| character_set_filesystem | binary |

| character_set_results    | latin1 |

| character_set_server     | latin1 |

| character_set_system     | utf8   |

+--------------------------+--------+

依旧是latin编码的。

OK。我将其编码设置一下

set character_set_client=utf8;

set character_set_connection=utf8;

set character_set_database=utf8;

set character_set_results=utf8;

set character_set_server=utf8;


再查询一下其编码格式为:

+--------------------------+--------+

| Variable_name            | Value  |

+--------------------------+--------+

| character_set_client     | utf8   |

| character_set_connection | utf8   |

| character_set_database   | utf8   |

| character_set_filesystem | binary |

| character_set_results    | utf8   |

| character_set_server     | utf8   |

| character_set_system     | utf8   |

+--------------------------+--------+

现在将数据导进来

source /python/django/sql/nginxdjango.sql;

其中的 nginxdjango.sql 其编码也是utf-8 格式的!

 

导进来 数据库查看居然还是乱码不过程序跑起来是正常了!

 

 

 

 

 

 

MySQL字符集编码的类型种类

gb2312_chinese_cigbk_chinese_ci以及gb2312_bin,gbk_bin的区别

gb2312_chinese_CI : 只支持简体中文

gb2312_BIN   :gb2312_bin可以说是gb2312_chinese_ci的一个子集,

而且gb2312_BIN是二进制存储.区分大小写数据库编码格式就意义不一样了
gbk_chinese_CI  
支持简体中文和繁体

gbk_bin   解释同gb2312_BIN     对应gbk_chinese_CI

PSGBK包括了简体与繁体两种类型

 

附表:

mysql字符集和整理列表

armscii8 (ARMSCII-8 Armenian)  

armscii8_bin  

亚美尼亚语, 二进制  

armscii8_general_ci  

亚美尼亚语, 不区分大小写  

ascii (US ASCII)  

ascii_bin  

西欧 (多语言), 二进制  

ascii_general_ci  

西欧 (多语言), 不区分大小写  

big5 (Big5 Traditional Chinese)  

big5_bin  

繁体中文, 二进制  

big5_chinese_ci  

繁体中文, 不区分大小写  

binary (Binary pseudo charset)  

binary  

二进制  

cp1250 (Windows Central European)  

cp1250_bin  

中欧 (多语言), 二进制  

cp1250_croatian_ci  

克罗地亚语, 不区分大小写  

cp1250_czech_cs  

捷克语, 区分大小写  

cp1250_general_ci  

中欧 (多语言), 不区分大小写  

cp1251 (Windows Cyrillic)  

cp1251_bin  

西里尔语 (多语言), 二进制  

cp1251_bulgarian_ci  

保加利亚语, 不区分大小写  

cp1251_general_ci  

西里尔语 (多语言), 不区分大小写  

cp1251_general_cs  

西里尔语 (多语言), 区分大小写  

cp1251_ukrainian_ci  

乌克兰语, 不区分大小写  

cp1256 (Windows Arabic)  

cp1256_bin  

阿拉伯语, 二进制  

cp1256_general_ci  

阿拉伯语, 不区分大小写  

cp1257 (Windows Baltic)  

cp1257_bin  

巴拉克语 (多语言), 二进制  

cp1257_general_ci  

巴拉克语 (多语言), 不区分大小写  

cp1257_lithuanian_ci  

立陶宛语, 不区分大小写  

cp850 (DOS West European)  

cp850_bin  

西欧 (多语言), 二进制  

cp850_general_ci  

西欧 (多语言), 不区分大小写  

cp852 (DOS Central European)  

cp852_bin  

中欧 (多语言), 二进制  

cp852_general_ci  

中欧 (多语言), 不区分大小写  

cp866 (DOS Russian)  

cp866_bin  

俄语, 二进制  

cp866_general_ci  

俄语, 不区分大小写  

cp932 (SJIS for Windows Japanese)  

cp932_bin  

日语, 二进制  

cp932_japanese_ci  

日语, 不区分大小写  

dec8 (DEC West European)  

dec8_bin  

西欧 (多语言), 二进制  

dec8_swedish_ci  

瑞典语, 不区分大小写  

euckr (EUC-KR Korean)  

euckr_bin  

朝鲜语, 二进制  

euckr_korean_ci  

朝鲜语, 不区分大小写  

gb2312 (GB2312 Simplified Chinese)  

gb2312_bin  

简体中文, 二进制  

gb2312_chinese_ci  

简体中文, 不区分大小写  

gbk (GBK Simplified Chinese)  

gbk_bin  

简体中文, 二进制  

gbk_chinese_ci  

简体中文, 不区分大小写  

geostd8 (GEOSTD8 Georgian)  

geostd8_bin  

乔治亚语, 二进制  

geostd8_general_ci  

乔治亚语, 不区分大小写  

greek (ISO 8859-7 Greek)  

greek_bin  

希腊语, 二进制  

greek_general_ci  

希腊语, 不区分大小写  

hebrew (ISO 8859-8 Hebrew)  

hebrew_bin  

希伯来语, 二进制  

hebrew_general_ci  

希伯来语, 不区分大小写  

hp8 (HP West European)  

hp8_bin  

西欧 (多语言), 二进制  

hp8_english_ci  

英语, 不区分大小写  

keybcs2 (DOS Kamenicky Czech-Slovak)  

keybcs2_bin  

捷克斯洛伐克语, 二进制  

keybcs2_general_ci  

捷克斯洛伐克语, 不区分大小写  

koi8r (KOI8-R Relcom Russian)  

koi8r_bin  

俄语, 二进制  

koi8r_general_ci  

俄语, 不区分大小写  

koi8u (KOI8-U Ukrainian)  

koi8u_bin  

乌克兰语, 二进制  

koi8u_general_ci  

乌克兰语, 不区分大小写  

latin1 (cp1252 West European)  

latin1_bin  

西欧 (多语言), 二进制  

latin1_danish_ci  

丹麦语, 不区分大小写  

latin1_general_ci  

西欧 (多语言), 不区分大小写  

latin1_general_cs  

西欧 (多语言), 区分大小写  

latin1_german1_ci  

德语 (字典), 不区分大小写  

latin1_german2_ci  

德语 (电话本), 不区分大小写  

latin1_spanish_ci  

西班牙语, 不区分大小写  

latin1_swedish_ci  

瑞典语, 不区分大小写  

 

 

latin2 (ISO 8859-2 Central European)  

latin2_bin  

中欧 (多语言), 二进制  

latin2_croatian_ci  

克罗地亚语, 不区分大小写  

latin2_czech_cs  

捷克语, 区分大小写  

latin2_general_ci  

中欧 (多语言), 不区分大小写  

latin2_hungarian_ci  

匈牙利语, 不区分大小写  

latin5 (ISO 8859-9 Turkish)  

latin5_bin  

土耳其语, 二进制  

latin5_turkish_ci  

土耳其语, 不区分大小写  

latin7 (ISO 8859-13 Baltic)  

latin7_bin  

巴拉克语 (多语言), 二进制  

latin7_estonian_cs  

爱沙尼亚语, 区分大小写  

latin7_general_ci  

巴拉克语 (多语言), 不区分大小写  

latin7_general_cs  

巴拉克语 (多语言), 区分大小写  

macce (Mac Central European)  

macce_bin  

中欧 (多语言), 二进制  

macce_general_ci  

中欧 (多语言), 不区分大小写  

macroman (Mac West European)  

macroman_bin  

西欧 (多语言), 二进制  

macroman_general_ci  

西欧 (多语言), 不区分大小写  

sjis (Shift-JIS Japanese)  

sjis_bin  

日语, 二进制  

sjis_japanese_ci  

日语, 不区分大小写  

swe7 (7bit Swedish)  

swe7_bin  

瑞典语, 二进制  

swe7_swedish_ci  

瑞典语, 不区分大小写  

tis620 (TIS620 Thai)  

tis620_bin  

泰语, 二进制  

tis620_thai_ci  

泰语, 不区分大小写  

ucs2 (UCS-2 Unicode)  

ucs2_bin  

Unicode (多语言), 二进制  

ucs2_czech_ci  

捷克语, 不区分大小写  

ucs2_danish_ci  

丹麦语, 不区分大小写  

ucs2_estonian_ci  

爱沙尼亚语, 不区分大小写  

ucs2_general_ci  

Unicode (多语言), 不区分大小写  

ucs2_icelandic_ci  

冰岛语, 不区分大小写  

ucs2_latvian_ci  

拉脱维亚语, 不区分大小写  

ucs2_lithuanian_ci  

立陶宛语, 不区分大小写  

ucs2_persian_ci  

波斯语, 不区分大小写  

ucs2_polish_ci  

波兰语, 不区分大小写  

ucs2_roman_ci  

西欧, 不区分大小写  

ucs2_romanian_ci  

罗马尼亚语, 不区分大小写  

ucs2_slovak_ci  

斯洛伐克语, 不区分大小写  

ucs2_slovenian_ci  

斯洛文尼亚语, 不区分大小写  

ucs2_spanish2_ci  

传统西班牙语, 不区分大小写  

ucs2_spanish_ci  

西班牙语, 不区分大小写  

ucs2_swedish_ci  

瑞典语, 不区分大小写  

ucs2_turkish_ci  

土耳其语, 不区分大小写  

ucs2_unicode_ci  

Unicode (多语言), 不区分大小写  

ujis (EUC-JP Japanese)  

ujis_bin  

日语, 二进制  

ujis_japanese_ci  

日语, 不区分大小写  

utf8 (UTF-8 Unicode)  

utf8_bin  

Unicode (多语言), 二进制  

utf8_czech_ci  

捷克语, 不区分大小写  

utf8_danish_ci  

丹麦语, 不区分大小写  

utf8_estonian_ci  

爱沙尼亚语, 不区分大小写  

utf8_general_ci  

Unicode (多语言), 不区分大小写[查看列编码常看到这样的编码格式的!] 

utf8_icelandic_ci  

冰岛语, 不区分大小写  

utf8_latvian_ci  

拉脱维亚语, 不区分大小写  

utf8_lithuanian_ci  

立陶宛语, 不区分大小写  

utf8_persian_ci  

波斯语, 不区分大小写  

utf8_polish_ci  

波兰语, 不区分大小写  

utf8_roman_ci  

西欧, 不区分大小写  

utf8_romanian_ci  

罗马尼亚语, 不区分大小写  

utf8_slovak_ci  

斯洛伐克语, 不区分大小写  

utf8_slovenian_ci  

斯洛文尼亚语, 不区分大小写  

utf8_spanish2_ci  

传统西班牙语, 不区分大小写  

utf8_spanish_ci  

西班牙语, 不区分大小写  

utf8_swedish_ci  

瑞典语, 不区分大小写  

utf8_turkish_ci  

土耳其语, 不区分大小写  

utf8_unicode_ci  

Unicode (多语

 

 

新篇:2010-03-09

MySQL中默认字符集的设置有四级:服务器级,数据库级,表级 。最终是字段级 的字符集设置。注意前三种均为默认设置,并不代码你的字段最终会使用这个字符集设置。所以我们建议要用show create table table ; 或show full fields from tableName; 来检查当前表中字段的字符集设置。

MySQL中关于连接环境的字符集设置有  Client端,connection, results 通过这些参数,MySQL就知道你的客户端工具用的是什么字符集,结果集应该是什么字符集。这样MySQL就会做必要的翻译,一旦这些参数有误,自然会导 致字符串在转输过程中的转换错误。基本上99%的乱码由些造成。

1. 数据库表中字段的字符集设置show create table TableName show full columns from tableName
mysql> show create table t1;

mysql> show full columns from t1; 查看列的编码类型

3. 查看数据库的编码格式

show create database test;

输出:CREATE DATABASE `test` /*!40100 DEFAULT CHARACTER SET utf8 */

2. 当前联接系统参数  show variables like 'char%'


mysql> show variables like 'char%';

1. 中文,请确保 表中该字段的字符集为中文兼容:
 big5     | Big5 Traditional Chinese
 gb2312   | GB2312 Simplified Chinese
 gbk      | GBK Simplified Chinese
 utf8     | UTF-8 Unicode


[其它补充]

修改数据库的字符集
   mysql>use mydb
   mysql>alter database mydb character set utf-8;

创建数据库指定数据库的字符集
   mysql>create database mydb character set utf-8;



2010-05-02 新添加进来
show variables like 'character\_set\_%'; 所查看到了几项中其中有这三项是受客户端影响

character_set_client
character_set_connection

character_set_results     

而这三项是可以通过 set names utf8|set names gbk来设置的!只是说明当前连接的客户端的编码情况并没有影响到数据库服务器本身的编码情况

 

 

 

阅读(2286) | 评论(6) | 转发(0) |
给主人留下些什么吧!~~

hkebao2010-05-05 14:21:51

2010作品年。做出自已的作品出来!

hkebao2010-05-05 14:21:22

保持知识库每天都要做更新处理。加油~为了目标与梦想

chinaunix网友2010-05-04 10:02:44

http://www.blueidea.com/tech/program/2009/6571.asp

hkebao2010-04-27 15:10:06

所有的变量,除了character_set_filesystem为binary;其他的均为utf8.呵呵,再次执行插入查找,中文都没有问题了。 看到没有这里面的文件系统编码为二进制的没错。

hkebao2010-04-16 15:35:20

今天遇到了一个问题就是在使用Django的ORM创建表的时候指定其编码。这个编码其实是与当前的所在的数据库的编码一样的。如果是latin的话其就是默认为latin了。如果是utf-8的话就是utf-8的编码了!不需要再从其他地方作指定了!而且表的编码在创建的时候所取到的默认编码值是与当前的数据库编码一样的