DB2中创建一个汉字拼音首字母的SQL函数（1）-sdccf-ChinaUnix博客

Fosdccf.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

sdccf

博客访问： 106439096
博文数量： 19283
博客积分： 9968
博客等级：上将
技术积分： 196062
用户组：普通用户
注册时间： 2007-02-07 14:28

文章分类

全部博文（19283）

香文化（0）
CU技术专题（2443）

Linux酷软（214）

tmp（0）

PostgreSQL（93）

Solaris（383）

AIX（173）

SCOUNIX（575）

DB2（1005）
涂鸦（9）
编程开发（1573）

Shell（386）

C/C++（1187）
数据库（6458）

MySQL（1750）

Sybase（465）

Oracle（3695）

Informix（548）
操作系统（8627）

HP-UX（0）

IBM AIX（2）

Sun Solaris（0）

BSD（1）

Linux（8597）

SCO UNIX（23）
未分配的博文（173）

文章存档

2011年（1）

2009年（125）

2008年（19094）

2007年（63）

我的朋友

最近访客

推荐博文

DB2中创建一个汉字拼音首字母的SQL函数（1）

分类：

2008-04-14 19:29:44

来源：赛迪网作者：zy

需求

有些时候我们会有这样的需求，要求使用字母从a至z对一组数据进行索引，如果数据的格式全部是半角的英文则很容易实现，但若是对一组中文数据进行索引则会引起一点小的麻烦，数据在录入数据库的时候可能并没有指定一个索引字母，这就要求应用程序可以自动生成用于索引的信息。

一般对于中文数据的索引，采用词组的首汉字拼音的首字母，例如：

词组 索引字母
－－－ －－－－－
熊猫 x
白暨豚 b
藏野驴 z

在DB2中并没有提供相应的函数可以取得汉字拼音的首字母，我们可以利用数据库针对中文字符集的排序功能创建一个这样的函数。

工作原理

我们知道在使用中文字符集的数据库中，当你对一列中文数据使用order by 排序时，排序的结果正是按照每行记录第一个汉字的拼音首字母进行排列的，那么我们需要想办法取得这个字母。

但是数据库内部是如何做到这一点的呢？以中文字符集GBK为例，让我们查看一下GBK字符集的内码表，我们仅摘出一段：

0 1 2 3 4 5 6 7 8 9 A B C D E F 
B040 癅 癆 癇 癈 癉 癊 癋 癎 癏 癐 癑 癒 癓 癕 癗 癘 
B050 癙 癚 癛 癝 癟 癠 癡 癢 癤 癥 癦 癧 癨 癩 癪 癬 
B060 癭 癮 癰 癱 癲 癳 癴 癵 癶 癷 癹 発 發 癿 皀 皁 
B070 皃 皅 皉 皊 皌 皍 皏 皐 皒 皔 皕 皗 皘 皚 皛 
B080 皜 皝 皞 皟 皠 皡 皢 皣 皥 皦 皧 皨 皩 皪 皫 皬 
B090 皭 皯 皰 皳 皵 皶 皷 皸 皹 皺 皻 皼 皽 皾 盀 盁 
B0A0 盃 啊 阿 埃 挨 哎 唉 哀 皑 癌 蔼 矮 艾 碍 爱 隘 
B0B0 鞍 氨 安 俺 按 暗 岸 胺 案 肮 昂 盎 凹 敖 熬 翱 
B0C0 袄 傲 奥 懊 澳 芭 捌 扒 叭 吧 笆 八 疤 巴 拔 跋 
B0D0 靶 把 耙 坝 霸 罢 爸 白 柏 百 摆 佰 败 拜 稗 斑 
B0E0 班 搬 扳 般 颁 板 版 扮 拌 伴 瓣 半 办 绊 邦 帮 
B0F0 梆 榜 膀 绑 棒 磅 蚌 镑 傍 谤 苞 胞 包 褒 剥

可以看到从B0A0-1 开始，至B0C0-5，是拼音A开头的汉字，恰好是按照拼音字母的先后顺序排列，并且把音调的因素也考虑进去了，由此，可以推断出，数据库在GBk编码的数据库中对汉字进行排序，即是依照字符内码表的编码进行的。

阅读(378) | 评论(0) | 转发(0) |

上一篇：怎样为DB2 XML数据开发Java应用程序（一）

下一篇：DB2中创建一个汉字拼音首字母的SQL函数（2）

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6