http://blog.csdn.net/ly21st http://ly21st.blog.chinaunix.net
分类: Oracle
2011-11-29 10:32:30
Oracle中汉字的乱码问题
ZDNet软件频道 时间:2007-10-06 作者:中国IT实验室 | 中国IT实验室
本文关键词:
在国内外大中型数据库管理系统中,把ORACLE作为数据库管理平台的用户比较多。ORACLE 不论是数据库管理能力还是安全性都是无可非议的,但是,它在汉 字信息的显示方面着实给中国用户带来不少麻烦,笔者多年从事ORACLE数据库管理。
+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
ly21st本人的解决方法:
NLS_LANG=AMERICAN_AMERICA.ZHS16GBK
export NLS_LANG
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
在国内外大中型管理系统中,把作为管理平台的用户比较多。 不论是管理能力还是安全性都是无可非议的,但是,它在汉 字信息的显示方面着实给中国用户带来不少麻烦,笔者多年从事管理,经常收到周围用户和外地用户反映有关汉字显示问题的求援信 ,主要现象是把汉字显示为不可识别的乱码,造成原来大量信息无法使用。本文将就这一问题产生的原因和解决办法进行一些探讨,供存在这方面问题的用户朋友参考。
1、原因分析
通过对用户反映情况的分析,发现字符集的设置不当是影响汉字显示的关键问题。那么字符集是怎么一会事呢?字符集是 为适应不同语 言文字显示而设定的。用于汉字显示的字符集主要有ZHS16CGB231280,US7ASCII,WE8ISO8859P1等。字符集不仅需在服务器端存在,而且客户端也必须有字符集 注册。服务器端,字符集是在安装时指定的,字符集登记信息存储在字典的V$NLS_PARAMETERS表中;客户端,字符集分两种情况,一种情况是sql*net 2.0以下版本,字符集是在windows的系统目录下的.ini文件中 登记的;另一种情况是sql*net 2.0以上(即32位)版本,字符集是在windows的系统注册表中登记的。要在客户端正确显示 汉字信息,首先必须使服务器端的字符集与客户端的字符集一致;其次是加载到的数据字符集必须与服务器指定字符集一致。因此,把用户存在的问题归纳分类,产生汉字显示异常的原因大致有以下几种:
1. 1服务器指定字符集与客户字符集不同,而与加载数据字符集一致。
这种情况是最常见的,只要把客户端的字符集设置正确即可,解决办法见2 .1。
1. 2服务器指定字符集与客户字符集相同,与加载数据字符集不一致。
这类问题一般发生在版本升级或重新安装系统时选择了与原来服务器端不同的字符集,而恢复加载的备份数据仍是按原字符集卸出的场合,以及加载从
其它使用不同字符集的卸出的数据的情况。这两种情况中,不管服务器端和客户端字符集是否一致都无法显示汉字。解决办法见2.2。
1.3服务器指定字符集与客户字符集不同,与输入数据字符集不一致。
这种情况是在客户端与服务器端字符集不一致时,从客户端输入了汉字信息 。输入的这些信息即便是把客户端字符集更改正确,也无法显示汉字。解决办法见2.3。
2.解决办法
下面将分别对上述三种情况给出解决办法。为了叙述方便,假设客户端使用 WINDOWS95/98环境,并已成功地配置了TCP/IP协议,安装了的sql*net,sql*pluse产品。
2.1 设置客户端字符集与服务器端字符集一致
假设当前服务器端使用US7ASCII字符集。
(1)查看服务器端字符集
通过客户端或服务器端的sql*plus登录的一个合法用户,执行下列SQL语句:
SQL > select * from V$NLS_PARAMETERS
parameter value
NLS_LANGUAGE AMERICAN
NLS_TERRITORY AMERICA
…. ….
NLS_CHARACTERSET US7ASCII
NLS_SORT BINARY
NLS_NCHAR_CHARACTERSET US7ASCII
从上述列表信息中可看出服务器端的字符集为'US7ASCII'。
(2)按照服务器端字符集对客户端进行配置
配置方法有两种:
安装的客户端软件时指定
在安装的客户端产品软件时,选择与服务端一致的字符集(本例为US7ASCII)即可。
修改注册信息的方法
根据 客户端所选sql*net 的版本分为下列两种情况:
a. 客户端为 sql*net 2.0 以下版本
进入Windows的系统目录,编辑.ini文件,用US7ASCII替换原字符集,重新启动计算机,设置生效。
b. 客户端为 sql*net 2.0 以上版本
在WIN98 下 运 行REGEDIT,第一步选HKEY_LOCAL_MACHINE,第二步选择SOFTWARE, 第三步选择 , 第四步选择 NLS_LANG, 键 入 与服务器端相同 的 字 符 集(本例为:AMERICAN_AMERICAN.US7ASCII)。
2.2 强制加载数据字符集与服务器端字符集一致
假设要加载数据从原卸出时的字符集为US7ASCII,当前服务器字符集为WE8ISO8859P1。
下面提供三种解决方法:
(1) 服务器端重新安装
在重新安装 时选择与原卸出数据一致的字符集(本例为US7ASCII)。
加载原卸出的数据。
这种情况仅仅使用于空库和具有同一种字符集的数据。
(2)强行修改服务器端当前字符集
在用imp命令加载数据前,先在客户端用sql*plus登录system DBA用户,执行下列SQL语句进行当前字符集修改:
SQL > create database character set US7ASCII
* create database character set US7ASCII
ERROR at line 1:
ORA-01031: insufficient privileges
你会发现语句执行过程中,出现上述错误提示信息,此时不用理会,实际上的字符集已被强行修改为US7ASCII,接着用imp命令装载数据。等数 据装载完成以后,shutdown ,再startup ,用合法用户登录,在sql>命令提示符下,运行select * from V$NLS_PARAMETERS,可以看到字符集已复原,这时再查看有汉字字符数据的表时,汉字已能被正确显示。
(3)利用数据格式转储,避开字符集限制
这种方法主要用于加载外来的不同字符集数据。其方法如下:
先将数据加载到具有相同字符集的服务器上,然后用转换工具卸出为foxbase 格式或access格式,再用转换工具转入到不同字符集的中,这样就避免了字符集的困扰。目前格式转换的工具很多,象powerbuilder5.0以上版本提供的pipeline,Microsoft Access提供的数据导入/导出功能等。转换方法参见有关资料说明。.
2.3匹配字符集替换汉字
对于1.3提到的情况,没有很好的办法,只能先把客户端与服务器端字符集匹配一致后,根据原输入汉字的特征码替换汉字字符部分。
原因:
出现中文乱码的主要原因是字符集不同。
在Oracle中,我们关心三个地方的字符集:
l Oracle服务器内部的字符集
l NLS_LANG变量里保存的字符集
l 客户端应用的字符集
Oracle服务器内部的字符集
这是Oracle数据库存储数据使用的字符集。
在Oracle中可能使用
Select userenv('language') from dual;
或者:
Select name, value$ from props$;
查看。
NLS_LANG变量里保存的字符集
这个是Oracle设置的一个变量。
在Windows中,这个变量保存在注册表中:
HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\HOME0保存着NLS_LANG变量。
在Unix/Linux中,则需要自己进行设置了。我本人是在.profile里面加上
NLS_LANG=AMERICAN_AMERICA.ZHS16GBK
export NLS_LANG
客户端应用的字符集
使用Oracle里数据或者向Oracle提供数据的应用程序。
如果 Oracle服务器内部的字符集 和 NLS_LANG变量里保存的字符集 相同,在进行Oracle查询时,就会将Oracle中的数据直接查出来,返回给查询用户。进行Oracle的插入操作,就会直接将插入的数据保存进数据库中。
但是如果不同的话,Oracle查询时,会根据这两个字符集的一个映射,将数据库中的数据作一个转换,再返回给查询用户。进行插入操作时,也会根据映射,将插入的数据作一个转换,再插入数据库。这也是产生乱码的原因,这一层转换,把数据都给转乱了。
解决办法:
将数据库的字符集和NLS_LANG字符集设置的一样,就可以避免乱码的出现了。
修改数据库字符集的步骤如下:
1、拥有修改权限(用管理用户登录)。
SQL> conn sys/sys as sysdba;
2、关闭数据库。
SQL>shutdown immediate;
3、启动数据库到Mount状态下。
SQL> STARTUP MOUNT;
ORACLE instance started.
Total System Global Area 76619308 bytes
Fixed Size 454188 bytes
Variable Size 58720256 bytes
Database Buffers 16777216 bytes
Redo Buffers 667648 bytes
Database mounted.
SQL> ALTER SESSION SET SQL_TRACE=TRUE;
Session altered.
SQL> ALTER SYSTEM ENABLE RESTRICTED SESSION;
System altered.
SQL> ALTER SYSTEM SET JOB_QUEUE_PROCESSES=0;
System altered.
SQL> ALTER SYSTEM SET AQ_TM_PROCESSES=0;
System altered.
4、启动数据库
SQL> Alter database open;
5、修改字符集
SQL> ALTER DATABASE CHARACTER SET ZHS16GBK;
注:
1. 如果数据库表中有CLOB类型的列,是不允许修改字符集的,解决方法为,先导出这个表的内容,然后删除这个表,修改完后,再导入这个表的内容就可以了。
2. 旧的字符集必须是新的字符集的子集,否则不能修改。
修改完后,可以查看一下修改是否成功。
6、关闭数据库
SQL> Shutdown immediate;
7、重新启动数据库
SQL> startup;
经过设置完Oracle字符集后,一般的乱码问题应该解决掉了。
在开发中,还遇到了这样一个问题:
数据库服务器和应用服务器都布署在Solaris上面了,建库的脚本也是在Solaris上面执行的,在Solaris上面查询数据是正常的,但是在Windows上用浏览器看时,就会变成?了。
这个问题的解决办法是,将数据库建库脚本在Windows上执行,再查看就都变正常了。
在solaris中语言变量为LANG=zh_CN,Solaris中的字符集在哪里设置?而且发现在Solaris中文环境下,vi编辑器无法显示中文,在单独的文本编辑器中却可以写上。是Solaris中的语言包安装的问题吗?应该如何配置?
为何下列的NLS_NCHAR_CHARACTERSET 与NLS_CHARACTERSET 却不一致,是否有影响?
SQL > select * from V$NLS_PARAMETERS
parameter value
NLS_LANGUAGE AMERICAN
NLS_TERRITORY AMERICA
… . ….
NLS_CHARACTERSET US7ASCII
NLS_SORT BINARY
NLS_NCHAR_CHARACTERSET WE8ISO8859P1
系统中设置NLS_LANG变量,与ORACLE中的NLS_LANG保持一致
我的电脑-->高级-->环境变量
新建一个环境变量
名字为
NLS_LANG
值为
SIMPLIFIED CHINESE_CHINA.ZHS16GBK
试试修改注册表中NLS_LANG为AMERICAN_AMERICA.UTF8
Oracle 8i中字符集乱码问题析及其解决办法 |
||||
|
||||
2001-10-19· ·石骁騑··yesky |
||||
|
ORACLE汉字乱码问题原因及解决方法
by wangd
原因:
出现中文乱码的主要原因是字符集不同。
在Oracle中,我们关心三个地方的字符集:
l Oracle服务器内部的字符集
l NLS_LANG变量里保存的字符集
l 客户端应用的字符集
Oracle服务器内部的字符集
这是Oracle数据库存储数据使用的字符集。
在Oracle中可能使用
Select userenv(''language'') from dual;
或者:
Select name, value$ from props$;
查看。
NLS_LANG变量里保存的字符集
这个是Oracle设置的一个变量。
在windows中,这个变量保存在注册表中:
HKEY_LOCAL_MACHINE\SOFTWARE\ORACLE\HOME0保存着NLS_LANG变量。
在Unix/LINUX中,则需要自己进行设置了。我本人是在.profile里面加上
NLS_LANG=AMERICAN_AMERICA.ZHS16GBK
export NLS_LANG
详细出处参考: