Chinaunix首页 | 论坛 | 博客
  • 博客访问: 390041
  • 博文数量: 165
  • 博客积分: 436
  • 博客等级: 下士
  • 技术积分: 887
  • 用 户 组: 普通用户
  • 注册时间: 2011-11-10 02:49
文章分类

全部博文(165)

文章存档

2012年(95)

2011年(70)

分类:

2012-01-31 16:32:26

原文地址:MySQL字符集相关 作者:ncjh

_from:

MySQL伴随着我已有四五年了,在使用MySQL的过程中,也碰到过字符编码问题(乱码)。
在Google中搜索“mysql 乱码”,可以查到“429,000”条结果;搜索“jsp 乱码”,可以查到“335,000”条结果,当然JSP乱码不一定就是MySQL乱码,但多数情况是编码问题(可能是页面编码、数据库编码)。
可见,编码问题在我们开发过程中是经常出现的,因此对编码的了解、设置和修改就显得及其重要了。
今天对MySQL边学习边查资料特意整理总结本文,以作备份,希望给各网友参考,一起学习讨论。

一、MySQL字符集和校对规则
我们都知道,字符集就是一套文字符号及其编码、比较规则的集合,因为计算机只认识二进制代码,所有我们必须要有一个转换。
MySQL的字符集包括字符集(Character Set)和校对规则(Collation)两个概念。字符集是用来定义MySQL存储字符串的方式,而校对规则则定义了比较字符串的方式。
字符集和校对规则是一对多的关系,每个字符集至少对应一个校对规则,称为默认校对规则。
查看所有字符集的命令:show character set;
或是查看information_schema.character_sets,可以得到所有的字符集和它的默认的校对规则,它的表结构:desc information_schema.character_sets;
查看字符集的校对规则:show collation like 'GBK%';
校对规则命名约定:以其相关的字符集名开始,通常包括一个语言名,并且以_ci(大小写不敏感)、_cs(大小写敏感)或_bin(二元,即比较是基于字符编码的值而与语言无关)结束。
实验命令:
select case when 'A' COLLATE utf8_general_ci = 'a' COLLATE utf8_general_ci then 'YES' else 'NO' end;(YES)
select case when 'A' COLLATE gbk_chinese_ci = 'a' COLLATE gbk_chinese_ci then 'YES' else 'NO' end;(YES)
select case when 'A' COLLATE gbk_bin = 'a' COLLATE gbk_bin then 'YES' else 'NO' end;(NO)

二、设置字符集
MySQL的字符集和校对规则有4个级别的默认设置:服务器级、数据库级、表级和字段级。
服务器级:
[mysqld]
default-character-set=utf8
[mysql]
default-character-set=utf8
或是启动时加上参数:mysqld --default-character-set=utf8
或是编译时加上参数:./configure --width-charset=utf8
查看字符集和校对规则:
show variables like 'character_set_server';
show variables like 'collation_server';

数据库级:
查看字符集和校对规则:
show variables like 'character_set_database';
show variables like 'collation_database';

表级:
查看字符集和校对规则:
show create table t \G

四、简单修改字符集
简单修改只对以后的数据有影响,如果数据库中没有数据或是不想修改以前的数据,可以使用简单修改。
简单修改命令:
alter database character set utf8;
alter table t character set utf8;
个人推荐在创建数据库时明确指定字符集和校对规则,避免受到默认值的影响。
创建数据库时指定:
create database databasename default charset GBK;
创建数据表时指定:
create table tablename(
....
) ENGIND=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_bin;

五、完全修改字符集
当数据库中已有数据,想修改数据集,不能通过简单的修改字符集完成,需要先将原数据导出,经过适当调整后重新导入才可完成。
通过七步完成字符集的完全修改(假设原字符集是latin1,想修改成GBK)。
1、导出表结构:
mysqldump -uroot -p --default-character-set=GBK -d databasename>createdb.sql
说明:
--default-character-set=GBK 表示设置以什么字符集连接;
-d 表示只导出表结构,不导出数据。
2、手工修改createdb.sql中表结构定义中的字符集(latin1)为新的字符集(GBK);
3、确保数据库中的数据不再更新,导出所有的数据:
mysqldump -uroot -p --quick --no-create-info --extended-insert --default-character-set=latin1 databasename>data.sql
说明:
--quick 该选项用于转储大的表,它强制mysqldump从服务器一次一行地检索表中的行而不是检索所有行,并在输出前将它缓存到内存中;
--extended-insert 使用包括几个values的多行insert语法;
--no-create-info 不要create table语句;
--default-character-set=latin1 表示按照原有的字符集导出所有的数据。
4、打开data.sql,将set names latin1修改成set names GBK;
5、使用新的字符集创建数据库:
create database databasename default charset GBK;
6、创建表:
mysql -uroot -p databasename < createdb.sql
7、导入数据:
mysql -uroot -p databasename < data.sql

六、最后
建议服务器的字符集参数不要修改,而是是创建数据库进加上字符集,特别是在创建表时记得加上,这样做的目的是为了使修改的影响最小化。

=======================================================

from:http://blog.csdn.net/millia/article/details/5806774

MySQL修改编码设置及乱码问题
分类: Millia's work 811人阅读 评论(1) 举报

 

     昨天尝试把自己用php编写的第一个糙站发布到网上..结果出现了因为编码不统一而导致乱码的想象..在"冷雨"童鞋的"控制下"终于把出现乱码的问题解决了...

     总结下因为数据库文件的写入和读出出现乱码的情况:


     一. 在前台连接写入的时候编码是不是与数据库编码符合

 

 $conn = @ MYSQL_CONNECT("localhost","root","")OR DIE ("数据库连接错误");

 MYSQL_SELECT_DB("millia",$conn);

 MYSQL_QUERY('SET NAMES UTF8');//使用UTF8而不是UTF-8中文编码

?>

 

     二、查看MYSQL数据库的编码

mysql> SHOW VARIABLES LIKE 'character_set_%';

+--------------------------+----------------------------+

| Variable_name | Value |

+--------------------------+----------------------------+

| character_set_client | latin1 |

| character_set_connection | latin1 |

| character_set_database | latin1 |

| character_set_results | latin1 |

| character_set_server | latin1 |

| character_set_system | utf8 |

| character_sets_dir | /usr/share/mysql/charsets/ |

+--------------------------+----------------------------+

7 rows in set (0.00 sec)

 

mysql> SHOW VARIABLES LIKE 'collation_%';

+----------------------+-------------------+

| Variable_name | Value |

+----------------------+-------------------+

| collation_connection | latin1_swedish_ci |

| collation_database | latin1_swedish_ci |

| collation_server | latin1_swedish_ci |

+----------------------+-------------------+

3 rows in set (0.00 sec)

      默认就是瑞典latin1,一下是换成我们自己的编码,如utf8:外部访问数据乱码的问题就出在这个connection连接层上,解决方法是在发送查询前执行一下下面这句:

     SET NAMES 'utf8';

     它相当于下面的三句指令:

     SET character_set_client = utf8;

     SET character_set_results = utf8;

     SET character_set_connection = utf8;

      一般只有在访问之前执行这个代码就解决问题了,下面是创建数据库和数据表的,设置为我们自己的编码格式。

 

     创建数据库时编码设置

     mysql> create database name character set utf8;

 

     创建表时编码设置

     CREATE TABLE `type` (`id` int(10) unsigned NOT NULL auto_increment,`flag_deleted` enum('Y','N') character set utf8 NOT NULL default 'N',`flag_type` int(5) NOT NULL default '0',`type_name` varchar(50) character set utf8 NOT NULL default '',PRIMARY KEY (`id`)) DEFAULT CHARSET=utf8;

 

     修改数据库成utf8.

     mysql> alter database name character set utf8;

 

     修改表默认用utf8.

     mysql> alter table type character set utf8;

 

     修改字段用utf8

     mysql> alter table type modify type_name varchar(50) CHARACTER SET utf8;

 

 

     附:MYSQL编码设置步骤

 

     一、编辑MySql的配置文件

     MySql的配置文件Windows下一般在系统目录下或者在MySql的安装目录下名字叫my.ini,可以搜索,Linux下一般是 /etc/my.cnf

 

--在 [mysql]  标签下加上一行

     default-character-set = utf8

 

--在 [mysqld] 标签下加上三行

     default-character-set = utf8

     character-set-server = utf8

     collation-server = utf8_general_ci

     init_connect = 'SET collation_connection = utf8_general_ci'

     init_connect = 'SET NAMES utf8'

     lower_case_table_names = 1        //表名不区分大小写(此与编码无关)

 

--在 [mysql.server]标签下加上一行

     default-character-set = utf8

 

--在 [mysqld_safe]标签下加上一行

     default-character-set = utf8

 

--在 [client]标签下加上一行

     default-character-set = utf8

 

     二、重新启动MySql服务

     Windows可在服务管理器中操作,也可使用命令行:

     net stop mysql 回车

     net start mysql 回车

     服务名可能不一定为mysql,请按自己的设置

 

     Linux下面可是用 service mysql restart

 

     如果出现启动失败,请检查配置文件有没有设置错误

 

     三、查看设置结果

     登录MySql命令行客户端:打开命令行

     mysql –uroot –p 回车

     输入密码

     进入mysql后 执行 :show variables like "%char%";

     显示结果应该类似如下:

     | character_set_client | utf8 |

     | character_set_connection | utf8 |

     | character_set_database | utf8 |

     | character_set_results | utf8 |

     | character_set_server | utf8 |

     | character_set_system | utf8 |

     | character_sets_dir | /usr/share/mysql/charsets/ |

 

     如果仍有编码不是utf8的,请检查配置文件,也可使用mysql命令设置:

     set character_set_client = utf8;

     set character_set_server = utf8;

     set character_set_connection = utf8;

     set character_set_database = utf8;

     set character_set_results = utf8;

     set collation_connection = utf8_general_ci;

     set collation_database = utf8_general_ci;

     set collation_server = utf8_general_ci;

     以上命令有部分只对当前登录有效,所以不是很管用。

 

     四、建库导入数据

     导入sql脚本文件前,先确保该脚本文件及内容格式为UTF-8编码格式,

     同以上方法登入mysql命令行,use 库名  进入相应数据库

     set names utf8;

     source sql脚本文件名;

 

     五、程序连接字符串(此项与mysql设置无关,为程序开发使用)

     对于较老的jdbc版本的驱动,连接字符创可使用一下相似格式:

jdbc:mysql://127.0.1:3306/test?useUnicode=true&characterEncoding=utf-8

 

     六、附录

     如果无法更改数据库配置文件,可以采取一下方法(不保证全部有效):

     1、建数据库时设置数据库编码为utf-8

     例如   create database `test` default character set utf8;

 

     2、导入数据库sql的时候,请确保sql文件为utf-8编码

     进入mysql命令行后输入    set names utf8;

     再进入数据库        use test;

     在导入sql脚本        source test.sql;

 

     3、连接字符串类似如下:(开发相关,非数据库设置)

jdbc:mysql://127.0.1:3306/test?useUnicode=true&characterEncoding=utf-8 

 

 

 

阅读(1464) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~