DB2用户定义函数实现多种语言的排序（6）-sdccf-ChinaUnix博客

Fosdccf.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

sdccf

博客访问： 106439473
博文数量： 19283
博客积分： 9968
博客等级：上将
技术积分： 196062
用户组：普通用户
注册时间： 2007-02-07 14:28

文章分类

全部博文（19283）

香文化（0）
CU技术专题（2443）

Linux酷软（214）

tmp（0）

PostgreSQL（93）

Solaris（383）

AIX（173）

SCOUNIX（575）

DB2（1005）
涂鸦（9）
编程开发（1573）

Shell（386）

C/C++（1187）
数据库（6458）

MySQL（1750）

Sybase（465）

Oracle（3695）

Informix（548）
操作系统（8627）

HP-UX（0）

IBM AIX（2）

Sun Solaris（0）

BSD（1）

Linux（8597）

SCO UNIX（23）
未分配的博文（173）

文章存档

2011年（1）

2009年（125）

2008年（19094）

2007年（63）

我的朋友

最近访客

推荐博文

DB2用户定义函数实现多种语言的排序（6）

分类：

2008-04-13 13:47:34

来源：互联网作者：Doug Doole

使用生成的列

如果数据库常常使用很少几个排序规则，那么可以考虑使用生成的列预先计算 SORTKEY 的结果，并将这些结果存储在数据库中。

例如，假设一个数据库通常只需要法语和德语排序规则。在这种情况下，根据表的总规模，可以考虑创建生成的列来保存 SORTKEY 的结果。例如：

清单 3. 创建生成的列来保存 SORTKEY 的结果

CREATE TABLE NAMES
    (
    NAME VARCHAR(50),
    NAME_FR_KEY VARCHAR(1200) GENERATED ALWAYS AS (ICU.SORTKEY(NAME, 'LFR')),
    NAME_DE_KEY VARCHAR(1200) GENERATED ALWAYS AS (ICU.SORTKEY(NAME, 'LDE'))
    )

    SELECT NAME FROM NAMES
    ORDER BY ICU.SORTKEY(NAME, 'LFR')

当 DB2 查询编译器对这个查询进行运算时，它会意识到 ICU.SORTKEY(NAME, 'LFR') 的值已经计算出来了，它会使用 NAME_FR_KEY 列来替代这个值。但是，如果查询使用 ICU.SORTKEY(NAME, 'LES') （西班牙语排序规则），那么 SORTKEY 函数必须作为查询的一部分执行。

不幸的是，将生成的列记录为 VARCHAR(1200) 值会占用表中的大量空间。好在，还有一些办法。

一个办法是修改 createfn.db2，让 SORTKEY 产生长度更短的结果类型。如果这样做了，那么应该减小 sortkey.c 中的常量 MAX_RESULT，还应该重新编译这个 UDF。

另一个办法是将 SORTKEY 的结果转换为更短的 VARCHAR 值。但是，对于使用生成的列的优化器，必须在每个引用中使用同样的转换。这种办法如下所示：

清单 4. 在每个引用中使用同样的转换

CREATE TABLE NAMES
    (
    NAME VARCHAR(50),
    NAME_FR_KEY VARCHAR(600)GENERATED ALWAYS AS (CAST(ICU.SORTKEY(NAME, 'LFR')
    AS VARCHAR(600))),
    NAME_DE_KEY VARCHAR(600)GENERATED ALWAYS AS (CAST(ICU.SORTKEY(NAME, 'LDE')
    AS VARCHAR(600)))
    )

    SELECT NAME FROM NAMES
    ORDER BY CAST(ICU.SORTKEY(NAME, 'LFR') AS VARCHAR(600))

总是需要指定转换，这使这种办法不够理想。可以使用下面的源函数将转换隐藏起来：

清单 5. 使用源函数将转换隐藏起来

CREATE FUNCTION MY_SORTKEY(VARCHAR(50), VARCHAR(50))
    RETURNS VARCHAR(600) FOR BIT DATASOURCE ICU.SORTKEYCREATE TABLE NAMES
    (
    NAME VARCHAR(50),
    NAME_FR_KEY VARCHAR(600) GENERATED ALWAYS AS (MY_SORTKEY(NAME, 'LFR')),
    NAME_DE_KEY VARCHAR(600) GENERATED ALWAYS AS (MY_SORTKEY(NAME, 'LDE'))
    )

    SELECT NAME FROM NAMES
    ORDER BY MY_SORTKEY(NAME, 'LFR')

不管使用哪种方法，重要的考虑因素都是生成的列的长度。SORTKEY 结果的长度可能比原来的字符串长。简单的规则是，对于输入字符串中的每个字符，在输出字符串中允许有 12 字节。（对于某些不常见的排序规则和输入值组合，这个空间甚至也可能不够。）但是，许多排序规则会产生比这短得多的排序键，因此在决定生成的列的大小时，对要使用的排序规则和数据进行一些实验是有帮助的。

阅读(309) | 评论(0) | 转发(0) |

上一篇：DB2用户定义函数实现多种语言的排序（5）

下一篇：DB2 v9发布——RDBMS与XML的完美结合

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6