分类:
2008-04-13 13:47:34
来源:互联网 作者:Doug Doole |
使用生成的列
如果数据库常常使用很少几个排序规则,那么可以考虑使用生成的列预先计算 SORTKEY 的结果,并将这些结果存储在数据库中。
例如,假设一个数据库通常只需要法语和德语排序规则。在这种情况下,根据表的总规模,可以考虑创建生成的列来保存 SORTKEY 的结果。例如:
清单 3. 创建生成的列来保存 SORTKEY 的结果
当 DB2 查询编译器对这个查询进行运算时,它会意识到 ICU.SORTKEY(NAME, 'LFR') 的值已经计算出来了,它会使用 NAME_FR_KEY 列来替代这个值。但是,如果查询使用 ICU.SORTKEY(NAME, 'LES') (西班牙语排序规则),那么 SORTKEY 函数必须作为查询的一部分执行。
不幸的是,将生成的列记录为 VARCHAR(1200) 值会占用表中的大量空间。好在,还有一些办法。
一个办法是修改 createfn.db2,让 SORTKEY 产生长度更短的结果类型。如果这样做了,那么应该减小 sortkey.c 中的常量 MAX_RESULT,还应该重新编译这个 UDF。
另一个办法是将 SORTKEY 的结果转换为更短的 VARCHAR 值。但是,对于使用生成的列的优化器,必须在每个引用中使用同样的转换。这种办法如下所示:
清单 4. 在每个引用中使用同样的转换
总是需要指定转换,这使这种办法不够理想。可以使用下面的源函数将转换隐藏起来:
清单 5. 使用源函数将转换隐藏起来
不管使用哪种方法,重要的考虑因素都是生成的列的长度。SORTKEY 结果的长度可能比原来的字符串长。简单的规则是,对于输入字符串中的每个字符,在输出字符串中允许有 12 字节。(对于某些不常见的排序规则和输入值组合,这个空间甚至也可能不够。)但是,许多排序规则会产生比这短得多的排序键,因此在决定生成的列的大小时,对要使用的排序规则和数据进行一些实验是有帮助的。 |