分类:
2008-10-16 19:26:08
关于索引是什么的最简单的比喻是,索引之于表数据如同目录之于一本书。
通过目录的页码我们可以快速的定位一个内容,同样通过索引记录的rowid我们可以快速的定位一条数据。
如同目录很难针对书中每个字词一样,索引也很难针对所有字段。
我们通常索引最能代表章节,记录属性的内容。
索引并非总能带来性能提升,但是通常情况下,索引能加快访问,所以建表的时候,你一定要知道还有索引这样一类对象。
下面这个案例是我们绝对不应该和不想看到的。
今天一个部门报数据库巨慢无比,上去看了一下,抓到如下的SQL:
SQL> select sql_text
2 from v$sqltext a
3 where a.hash_value = (
4 select sql_hash_value from v$session b
5 where b.sid='&sid'
6 )
7 order by piece asc
8 /
SQL_TEXT
----------------------------------------------------------------
select * from i_cm_power t WHERE T.SJH='13911xxxxx6'
检查了一下该查询访问的数据表,居然一个索引都没有:
SQL> select index_name from dba_indexes where table_name=upper('i_cm_power');
INDEX_NAME
------------------------------
没有索引意味着,即使为了获取这一条记录,也必须对5.28G的一个表进行全表扫描,如果不慢那就怪了:
SQL> col segment_name for a20
SQL> select segment_name,bytes/1024/1024/1024
from dba_segments where segment_name=upper('i_cm_power');
SEGMENT_NAME BYTES/1024/1024/1024
-------------------- --------------------
I_CM_POWER 5.28173828125
创建一个索引再说:
SQL> create index idx_i_cm_power_sjh on i_cm_power(sjh);
Index created.
Elapsed: 00:20:50.73
SQL> col segment_name for a20
SQL> select segment_name,bytes/1024/1024 MB
2 from dba_segments where segment_name=upper('idx_i_cm_power_sjh');
SEGMENT_NAME MB
-------------------- ----------
IDX_I_CM_POWER_SJH 1360
SQL>
无疑这个索引对于这样的简单查询是大有益处的:
SQL> select * from i_cm_power t WHERE T.SJH='13911xxxxx6';
Elapsed: 00:00:00.07
Execution Plan
----------------------------------------------------------
0 SELECT STATEMENT Optimizer=CHOOSE
1 0 TABLE ACCESS (BY INDEX ROWID) OF 'I_CM_POWER'
2 1 INDEX (RANGE SCAN) OF 'IDX_I_CM_POWER_SJH' (NON-UNIQUE)
Statistics
----------------------------------------------------------
0 recursive calls
0 db block gets
6 consistent gets
0 physical reads
0 redo size
1022 bytes sent via SQL*Net to client
503 bytes received via SQL*Net from client
2 SQL*Net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
2 rows processed
然而在实际中,你需要考虑更多的因素。
增加索引会占用更多的空间;索引的维护会增加数据库的负担,如果有海量的数据加载,可能会极大影响性能...
所以事实可能总是比你想象的更复杂,你只有知道的更多...