Chinaunix首页 | 论坛 | 博客
  • 博客访问: 310650
  • 博文数量: 94
  • 博客积分: 2220
  • 博客等级: 大尉
  • 技术积分: 975
  • 用 户 组: 普通用户
  • 注册时间: 2004-12-17 21:17
文章分类

全部博文(94)

文章存档

2011年(5)

2010年(11)

2009年(1)

2008年(2)

2006年(1)

2005年(65)

2004年(9)

我的朋友

分类: DB2/Informix

2005-07-08 12:23:08

informix支持中文问题汇总

Online5版本时可以存储任何字符串,包括所有中文字符串与英文字符串,不加任何限制,不需安装其它附加产品,不必设置其它环境变量。 

Online 7.2版以前遵从X/OpenNLS(Native  Language  Support)的标准支持中文(XPG3 规范),不必安装附加语言支持产品。这是一种单字节的支持方式,前提是操作系统也要支持NLS,换句话说,Online是基于操作系统支持中文的。一般设 置操作系统环境变量LANG之后,重新启动Online后,原来的数据库即可处理中文,有时也要设DBNLS环境变量。不同的操作系统的LANG的设置方 法一般不同,下面列出HPSCO上的设法: 
SCO  UNIX
export  LANG =  english_us.8859 
HP-UX
  export  LANG =  en_US.iso88591 



ONLINE
7.2以上版本采用GLS(Global  Language  Support)的方式支持中文,GLS是基于 X/OpenXPG4规范之上开发的,这是一种多字节的全球语言支持方式。在安装完Online之后,必须正确安装Informix   -  Language  Supplement  ZHCN产品,并设置适当的环境变量,然后启动 ONLINE,重新建立数据库,才可处理汉字。方法如下: 
1
)按照INFORMIX产品安装方法,最后安装Informix  Language  Supplement  ZHCN 
2
)一般设置下面三个环境变量: 
export  DB_LOCALE=zh_CN.gb 
export  CLIENT_LOCALE=zh_CN.gb 
export  SERVER_LOCALE=zh_CN.gb 
除了这三个环境变量之外,DBLANG=en_us.8859-1可以指定Informix产品内部使用英文。 
3)正常启动ONLINE 
4
)重新建立数据库 


本技术说明使用的术语和首字母缩略词包括: 

GLS 
全球语言支持(Global  Language  Support)。 
语言环境(Locale 
语言、地域和代码集 
本地化(Localize 
使软件用于特定的语言环境 
国际化(Internationalize 
使软件用于任何语言环境 
UDR 
用户定义的例程 
简介 


国际化的用户定义的例程(UDR)无需修改和重新编译源代码即可支持不同的语言和文化约定。 

Informix  GLS 
库是一个  API,它让  UDR 处理单字节和多字节字符并管理日期、时间和数值的不同数据格式。 GLS 函数可以在运行时访问特定于语言环境的信息,因而  UDR 无需知道客户机的语言环境,就可以让客户机采取正确的行为。 
本技术说明突出说明了实现国际化的  UDR 时要考虑的问题,并指出了您可能要为特定语言额外提供的支持。 
GLS 概述与定义 
球语言支持(Global  Language  Support (GLS))是允许  Informix 产品、单个应用程序或  UDR 支持多种语言的  Informix 特性。本节概述了一些重 要术语。 
GLS 
语言环境 
对应于语言、地域和代码集: 
语言(language)指定可以使用的字符种类、如何对字符进行排序和比较、字母大小写转换和消息。 
地域(territory)确定日期、时间、货币和数字的格式。 
代码集(code  set)包括单字节和多字节字符串处理,以及同一字符在客户机和服务器上不同表示法之间的代码集转换。 

缺省的  Informix 语言环境如下: 
en_us.8859-1  UNIX  8859-1 
  ISO8859-1 代码集。 
en_us.1252  Windows  1252 
  Microsoft 代码集。 

ISO8859-1 
代码集有另外一些形式。0333 是其精简形式,而  IBM 又将  ISO8859-1 注册为  CCSID  819。因此以下三种语言环境指的是同一代码集: 
en_us.8859-1 
en_us.0333 
en_us.819 
Informix 
使用以下环境变量来指定语言环境: 
CLIENT_LOCALE 
客户机应用程序使用的语言环境。 
DB_LOCALE 
数据库中数据的语言环境。 
SERVER_LOCALE 
数据库服务器用于其特定于服务器的文件的语言环境。 
国际化 
指的是实现产品(如  DataBlade 模块),以便它们与语言无关。国际化的  UDR 无需更改或重新编译源代码即可支持不同语言、地域和代码集。 
Informix 
服务器是国际化的产品。Informix  GLS 库提供了一些函数,以使  DataBlade 模块和客户机应用程序能使用  GLS 语言环境中的信息来: 
处理单字节和多字节字符 
格式化日期、时间和数值数据 
本地化 
指的是在运行时解析特定语言环境的信息,以使国际化的产品针对该语言环境正确执行;例如,本地化的应用程序使用户能看到用他们自己的语言显示的错误消息和用他们期望的格式显示的日期。 

特定语言环境的支持集中在一组文件中。(特定于语言环境的  DataBlade 消息存储在系统目录中)。UNIX  glfiles 命令会输出  UNIX 系统支持的语言环境的列表。对于  Informix 分发版中没有包括 的语言环境,International  Language  Supplement 提供语言环境、代码集转换和已翻译 的用户界面与文档。 
尽管本技术说明主要讨论  UDR 实现,但  DataBlade 开发人员也需要考虑任何客户机组件的国际化,这些组件是作为  DataBlade 模块的一部分而包括在模块中的。 
GLS 产品 
GLS 
文档 
DataBlade 
开发人员需要以下文档: 
Informix  Guide  to  GLS  Functionality 
这是实现支持  GLS 的产品的核心文档。 


Informix  GLS  Programmer's  Manual 
该手册描述如何使用  Informix  GLS  API 调用。 


GLS documentation  and  Release  Notes 
请常常查看最新的分发版以获得新的信息: 

$INFORMIXDIR/release 

Informix  DataBlade  API  Programmer's  Manual 
讨论用于产生错误和输出跟踪消息的  GLS 特性。 


DataBlade  Developers  Kit  User's  Guide 
DBDK 
生成使用  GLS 调用的源代码。 



DataBlade 
开发人员需要什么  Informix 产品? 
您需要以下  Informix 产品来实现支持多语言的  DataBlade 模块: 

Informix  Dynamic  Server 


DataBlade  Developers  Kit 
BladeSmith 
生成使用多个  GLS 库函数的代码,包括用于异常处理和跟踪的函数。 


Client  Software  Development  Kit 


International  Language  Supplement (ILS)
,用于所有您计划支持但缺省分发版没有包括的语言环境(用  glfiles 命令检查),以使您能在每个语言环境中测试  blade 的行为。 


您还需要前面的  GLS 文档一节中列出的文档。 

客户需要什么  Informix 产品? 
您的客户需要以下产品以在其语言环境中运行您的  DataBlade 模块: 

Informix  Dynamic  Server 


您的  DataBlade 模块 


用于客户的语言环境的  International  Language  Supplement (ILS)(如果它尚未包括在分发版中的话)。 

客户还必须通过适当地设置  CLIENT_LOCALE   DB_LOCALE 环境变量来正确地设置其  GLS 环境。 


什么需要国际化/本地化? 


DataBlade 
模块开发人员必须同时解决国际化问题与本地化问题。首先,您需要实现  UDR 以使其与语言无关。也就是说,对于其要处理的数据, DataBlade 模块不对在运行时使用的语言、地域或代码集做任何假定。因此您就需要将任何与语言有关的部分(如错误消息)移植到您希望支持的每一个 语言环境。本节概述了一些问题。 

文本  I/O 
Informix  GLS 
库提供这样的函数,它们使用当前正在处理的语言环境中的信息来扫描和格式化多字节字符串、日期、数字和货币。使用这些函数来解析输入字符串或格式化输出字符串。它们在以下文档中有描述: 

Informix  Guide  to  GLS  Functionality 

Informix  GLS  Programmer's  Manual 


在何处将这一点应用到  UDR 的示例是对  opaque 类型外部(基于字符)格式的处理。 

DBDK 
  opaque 类型输入/输出支持函数生成代码,该代码在  GLS 文本与  opaque 类型内部二进制表示法之间进行转换。 


mi_get_string()   mi_put_string()  DataBlade  API 函数自动对字符串/文本数据执行代码集转换。 

(对于数值数据的二进制传送,mi_put_*   mi_get_* 函数 — 用于  opaque 类型发送/接收支持函数 — 也会自动执行代码集转换)。 

错误消息 
syserrors 
系统目录表存储  DataBlade 异常消息,这些消息可以通过向  mi_db_error_raise() 传递   MT_SQL 消息类型来产生。每个错误消息项都有与之相关的语言环境。当错误被产生时,服务器会设法将  CLIENT_LOCALE   syserrors 中的一个错误匹配。它首先进行显式匹配,如果找不到匹配的对象,则以下列 次序进行搜索,尝试部分匹配: 

确切的客户机语言环境 
例如:es_es.8859-1 


客户机语言环境的语言 + 地域 
例如:es_es 


仅客户机语言环境的语言 
例如:es 


缺省(en_us)语言环境 
UNIX 
上的  en_us.8859-1,以及  NT 上的  en_us.1252 

解析出最终缺省  en_us 语言环境的方法取决于用户是否设置了  CLIENT_LOCALE 

如果未设置  CLIENT_LOCALE,则根据语言环境的部分匹配得出缺省语言环境。 
如果  en_us.1252NT)错误位于  UNIX 服务器上的  syserrors 表中,则根据  en_us 部分匹配查找消息。 


如果设置了  CLIENT_LOCALE,则根据对该平台的完全匹配解析出缺省语言环境。 
如果  en_us.1252NT)错误位于  UNIX 服务器上的  syserrors 表中,则将根据  en_us.8859-1 的完全匹配查找语言环境,从而产生 "Message  cannot  be  found" 错误。 

务器的  9.2 发行版都将执行  en_us 语言环境的部分匹配,而不管是否设置了  CLIENT_LOCALE。同时,要意识到  BladeSmith 缺省时生成语言环境为  en_us.1252 的消息。如果您的目标是  UNIX 系统,请将语言环境更改为  en_us.8859- 1。如果您计划支持  NT   UNIX,请同时向两个语言环境注册同一错误消息。 

您还可以将   DataBlade 异常消息翻译成您打算支持的各种特定语言,并将这些消息存储在  syserrors 系统目录 表。(顺便说一下,如果您希望使用  UDR 插入本地化的消息,请参阅下面的  UDR 将本地化错误消息插入到   syserrors 一节)。 

请参阅  Informix  DataBlade  API  Programmer's  Manual “Exception  Raising”一节和下面的示例。 

跟踪消息 
systracemsgs 
系统目录存储可以用  gl_tprintf() 输出的  DataBlade 跟踪消息。除了翻译所有要显示给最终用户的跟踪消息以外,请务必提供  en_us 缺省消息。 

请参阅  Informix  DataBlade  API  Programmer's  Manual 中的“DataBlade  API  Support  for  an  Internationalized  UDR”一节。 

查询处理 
Informix 
支持用于数据库对象的名称(如表和列)的多字节字符。当然,表可以在  NCHAR   NVARCHAR 列中存储包含多字节字符的值。 

查使用  mi_exec()   mi_exec_prepared_statement() 执行  SQL 查询的任何  UDR。如果查询可以访问用户定义的数据库对象或获取用户提供的数据,则  UDR 应该在 创建  SQL 语句和获取查询结果时准备好处理非  ASCII 字符。 


示例 


错误消息 
RGBA  DataBlade 
模块实现管理计算机颜色的  opaque 类型。 

  RGBA 的输入函数将外部(文本)表示法转换成内部的  数据结构。当填充了  结构后, DataBlade 代码会检查每个元素是否在  0-255 内。如果用户输入  256,则根据用户的语言环境会产生与 下面相似的错误: 

语言环境 错误消息 
en_us.1252 (URGB1)  -  RGBAInput:  value  256  is  not  within  the  valid  range  of  0-255. 
es_es.8859-1 (URGB1)  -  RGBAInput:  el  valor  R  256  no  calza  entre  los  limites  de  0-255. 

本节描述源代码需要做什么、要将什么消息存储在  syserrors 表中,以及数据库服务器如何决定输出哪个错误。 

下面的代码演示输入函数如何检查  RGBA 的红色部分以及如何产生错误。 

if(Gen_RetVal->red <  0 ||  Gen_RetVal->red >  255) 
mi_db_error_raise 

Gen_Con, /*  Connection  handle */ 
MI_SQL, /*  Message  type */ 
"URGB1", /*  SQLSTATE  in  syserrors */ 
"FUNCNAME%s", /*  token  takes  string */ 
"RGBAInput", /* value  for  FUNCNAME */ 
"value%d", /*  token  takes  an  integer */ 
(mi_integer)  Gen_RetVal->red, /* value  for value  token */ 
NULL /*  No  more  tokens */ 
); 
mi_db_error_raise () 
调用中的  MI_SQL 消息类型表明应该根据第三个参数中的  SQLSTATE 值在  syserrors 系统目录表中查找错误。如果我们从  syserrors 系统目录进行选择,我们会看到有两个不同的 “URGB1”错误: 

>  select *  from  syserrors  where  sqlstate='URGB1'

sqlstate  URGB1 
locale  en_us.1252 
level 
seqno 
message %FUNCNAME%:  value %value%  is  not  within  the  valid  range  of  0-255. 

sqlstate  URGB1 
locale  es_es.8859-1 
level 
seqno 
message %FUNCNAME%:  el  valor  R %value%  no  calza  entre  los  limites  de  0-255. 
用以下  SQL 插入(insert)语句将这些异常消息插入到  syserrors 系统目录表中: 

insert  into  informix.syserrors (level,  seqno,  sqlstate,  locale,  message) 
value

0, 
1, 
"URGB1"
"en_us.1252"
"%FUNCNAME%:  value %value%  is  not  within  the  valid  range  of  0-255." 
); 

insert  into  informix.syserrors (level,  seqno,  sqlstate,  locale,  message) 
value

0, 
1, 
"URGB1"
"es_es.8859-1"
"%FUNCNAME%:  el  valor  R %value%  no  calza  entre  los  limites  de  0-255." 
); 
RGBA 

阅读(1746) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~