Oracle数据库中Web分页方法详细介绍-sdccf-ChinaUnix博客

Fosdccf.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

sdccf

博客访问： 108553321
博文数量： 19283
博客积分： 9968
博客等级：上将
技术积分： 196062
用户组：普通用户
注册时间： 2007-02-07 14:28

文章分类

全部博文（19283）

香文化（0）
CU技术专题（2443）

Linux酷软（214）

tmp（0）

PostgreSQL（93）

Solaris（383）

AIX（173）

SCOUNIX（575）

DB2（1005）
涂鸦（9）
编程开发（1573）

Shell（386）

C/C++（1187）
数据库（6458）

MySQL（1750）

Sybase（465）

Oracle（3695）

Informix（548）
操作系统（8627）

HP-UX（0）

IBM AIX（2）

Sun Solaris（0）

BSD（1）

Linux（8597）

SCO UNIX（23）
未分配的博文（173）

文章存档

2011年（1）

2009年（125）

2008年（19094）

2007年（63）

我的朋友

相关博文

Oracle数据库中Web分页方法详细介绍

分类： Oracle

2008-04-06 22:28:00

来源：赛迪网技术社区作者：sanandi

随着Internet技术的发展，Web已越来越多的被应用到各行各业。传统的基于大机或C/S结构的应用也正逐渐的为B/S（Browser/Server）结构所代替。而数据库，作为保存着大量信息的容器，使得Web应用能够提供更加丰富多彩，及时、个性化的信息。在Web应用中，我们经常遇到需要从数据库搜索出满足某个特征的数据记录，再显示给特定用户。常常这些满足条件的记录如此之多，一方面在同一个页面显示显得异常臃肿而不切实际，另一方面用户通常也不会对他们都感兴趣，他们似乎更关心按一定规则排序出现在某些开始位置的若干记录。这就要求我们对满足条件的数据进行分页，将用户更关心的记录放在首页，同时给予是否继续浏览（或跳跃式阅读）到指定页甚至最后一页的自由。在这里，我们希望和大家讨论一下使用Oracle数据库时的Web分页方法。

我们说，一个好的分页方法，它应当满足以下几个要求：

1. 数据库处理的数据量最小；

2. 数据库与Web应用服务器之间的数据量传输最小。

假定我们有如下的业务：行业产品表，10万记录，字段包括产品名称，所在行业，市场价格。要求选择某个行业时，列出该行业下所有产品，并按产品名称排序，超过20条的，按每页20条分页：

　　
　　rudolf@TEST902>create table t nologging
　　2　as select object_name product_name,mod(object_id,4)*10 category,
　　3　　　　　　object_id price,rpad('a',300,'b') supplier
　　4　　　 from all_objects order by 2,1
　　5　/
　　
　　Table created.
　　
　　rudolf@TEST902>select count(*) from t;
　　
　　COUNT(*)
　　----------
　　21110

用以上语句，我们快速生成了一个行业产品表，其中all_objects为Oracle的一个系统表（我们常常可以使用类似的方法生成测试数据）。接下来，我们创建了索引，并为使用CBO分析了表，分析显示该表共用去1039个数据块：

　　
　　rudolf@TEST902>create index t_category_pname_ind on t (category,product_name)
　　2　nologging
　　3　tablespace indx
　　4　/
　　
　　Index created.
　　
　　rudolf@TEST902>analyze table t compute statistics
　　2　for table
　　3　for all indexes
　　4　for all indexed columns
　　5　/
　　
　　Table analyzed.
　　
　　rudolf@TEST902>select table_name,blocks,
    empty_blocks from user_tables where table_name = 'T';
　　
　　TABLE_NAME　　　　　　　　　　　　 BLOCKS EMPTY_BLOCKS
　　------------------------------ ---------- ------------
　　T　　　　　　　　　　　　　　　　　　1039　　　　　113

为了便于讨论，我们先来看一下传统的做法:

　　
　　rudolf@TEST902>select * from
　　2　 ( select rownum rnm, a.* from
　　3　　 ( select * from t where category = &category_id
　　4　　　　 order by product_name
　　5　　 ) a
　　6　) where rnm between &minrnm and &maxrnm
　　7

这里我们使用了三个变量，其中category_id表示用户感兴趣的行业，而minrnm,maxrnm则来模拟Web程序控制分页时传入的最小、最大行号。我们希望选出行业为20，属于第289页的所有产品信息。我们猜测上述语句将按以下步骤执行：

1. 取出所有满足category=&category_id的记录；

2. 按product_name进行排序；

3. 在排序完毕的结果集中取出第&minrnm到&maxrnm记录之间的数据。

　　
　　rudolf@TEST902>set autot trace
　　rudolf@TEST902>/
　　Enter value for category_id: 20
　　Enter value for minrnm: 4981
　　Enter value for maxrnm: 5000
　　
　　20 rows selected.
　　
　　Execution Plan
　　
　　0　　　SELECT STATEMENT Optimizer=FIRST_ROWS (Cost=436 Card=5263 Bytes=1094704)
　　1　　0　 VIEW (Cost=436 Card=5263 Bytes=1094704)
　　2　　1　　 COUNT
　　3　　2　　　 VIEW (Cost=436 Card=5263 Bytes=1026285)
　　4　　3　　　　 SORT (ORDER BY) (Cost=436 Card=5263 Bytes=1010496)
　　5　　4　　　　　 TABLE ACCESS (BY INDEX ROWID) OF 'T'
   (Cost=284 Card=5263 Bytes=1010496)
　　6　　5　　　　　　 INDEX (RANGE SCAN) OF 'T_CATEGORY_PNAME_IND' 
   (NON-UNIQUE) (Cost=31 C
　　ard=5263)
　　
　　Statistics
　　0　recursive calls
　　0　db block gets
　　284　consistent gets
　　0　physical reads
　　0　redo size
　　1829　bytes sent via SQL*Net to client
　　514　bytes received via SQL*Net from client
　　3　SQL*Net roundtrips to/from client
　　1　sorts (memory)
　　0　sorts (disk)
　　20　rows processed

我们可以根据执行计划第二列的数字来阅读计划，即数字大的最先执行，如“5 index (range scan)”，数字相等时，按从上到下的顺序执行。上述执行计划显示了与我们估计相同的顺序，我们看到满足where条件的记录一共5263条左右（第4步中的 card=5263），它们全部被取出，并参与排序（第3步），并在将结果集返回给用户前，一直在处理所有的5263条记录。然而事实上用户似乎只关心本页即20条记录。显然它与我们关于数据库处理量最小的要求相距甚远。在分析部分，284个一致读进一步说明数据库处理了所有满足条件的记录（整个表占1039个数据块，共4个拥有相近产品数的行业，则每个行业约占259个数据块）。

现在，我们把上述语句换成：

　　
　　rudolf@TEST902>select * from t
　　2　 where category = &category_id
　　3　 order by product_name
　　4

将满足条件的所有记录取到客户端（在这里为Web应用服务器），然后利用编程语言对结果集分页。以JAVA为例，可以使用ResultSet对象方法absolute直接定位记录而方便地将结果集分页。然而很显然，它甚至满足关于数据库与Web应用服务器之间的数据量传输最小的要求，很多情况下将明显影响性能，严重时甚至会导致Web应用服务器一端内存溢出。言归正传，我们开始引入我们的方法。

方法一：同分析传统做法类似，我们先列出我们的方法：

　　
　　rudolf@TEST902>select * from
　　2　( select rownum rnm, a.* from
　　3　　( select * from t where category = &category_id
　　4　　　　order by category,product_name
　　5　　) a where rownum <= &maxrnm
　　6　) where rnm >= &minrnm
　　7

与传统做法不同，我们把对最大行号的判断从第三层移到了第二层。改变虽然简单，然而它表达了一个完全不同的执行意图。内部视图：

　　
　　select rownum rnm, a.* from
　　( select * from t where category = &category_id
　　order by category,product_name
　　) a where rownum <= &maxrnm

是8i引入的新操作，在执行计划中，它体现为stopkey。这种操作专门为提取TOP n的需求做了优化。它需要排序字段预先建有索引，由于索引是已排序好的结构，因此取TOP n的问题，就变为从索引中直接从头提取n个索引关键字，然后再根据索引就可快速的找到记录并返回给用户。从而有效避免了检索全部记录的情况。

　　
　　rudolf@TEST902>set autot trace
　　rudolf@TEST902>set verify off
　　Enter value for category_id: 20
　　Enter value for maxrnm: 20
　　Enter value for minrnm: 1
　　
　　20 rows selected.
　　
　　Execution Plan
　　0　　　SELECT STATEMENT Optimizer=FIRST_ROWS 
    (Cost=284 Card=20 Byte
　　s=4160)
　　1　　0　 VIEW (Cost=284 Card=20 Bytes=4160)
　　2　　1　　 COUNT (STOPKEY)
　　3　　2　　　 VIEW (Cost=284 Card=5263 Bytes=1026285)
　　4　　3　　　　 TABLE ACCESS (BY INDEX ROWID) OF 'T'
    (Cost=284 Card=
　　5263 Bytes=1010496)
　　5　　4　　　　　 INDEX (RANGE SCAN) OF 'T_CATEGORY_PNAME_IND'
    (NON-UNIQUE) (Cost=31 Card=5263)
　　
　　Statistics
　　0　recursive calls
　　0　db block gets
　　7　consistent gets
　　0　physical reads
　　0　redo size
　　1848　bytes sent via SQL*Net to client
　　514　bytes received via SQL*Net from client
　　3　SQL*Net roundtrips to/from client
　　0　sorts (memory)
　　0　sorts (disk)
　　20　rows processed

应将count(stopkey)操作与table access(by index rowid)结合起来看，这样一来，table access(by index rowid)实际上只处理了&maxrnm条记录，这里为20条

阅读(205) | 评论(0) | 转发(0) |

上一篇：利用Oracle执行计划机制提高查询性能

下一篇：处处设防数据库安全性策略详细介绍

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6