批量加载数据索引处理方式-oracle狂热分子-ChinaUnix博客

东东堂的数据库小屋oracn.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

oracle狂热分子

博客访问： 2826246
博文数量： 389
博客积分： 4177
博客等级：上校
技术积分： 4773
用户组：普通用户
注册时间： 2008-11-16 23:29

文章分类

全部博文（389）

MongoDB（3）
12C新特性（15）
Undo/Redo（8）
ASM（7）
Enqueue/Lock（1）
Block（9）
Index（5）
Buffer Pool（7）
Shared Pool（4）
AMM/ASMM（10）
Optimizer（19）
Latch/Mutex（4）
MySQL（69）
Exadata（6）
Timesten（15）
SHELL/PERL（7）
其他（7）
LINUX（24）
DATA GUARD（14）
性能调整（12）
RAC（21）
GOLDENGATE（8）
备份与恢复（23）
问题处理（10）
EM 12C（2）
OCP（32）
数据库理论（1）
存储（3）
oracle（43）
未分配的博文（0）

推荐博文

相关博文

批量加载数据索引处理方式

分类： Oracle

2016-05-29 22:06:35

批量加载数据索引处理方式

在大批量导数入数据时候,如果字段上有索引,那么每次insert数据都要进行索引维护操作,这种方式
使用的是随机IO的方式.如果对像的索引在数据导入后再增加,那么重建索引索引的时候使用的是批量处理
方式,相比之前的方式,后一种的效率会非常高.

我们使用oracle 11G来验证一下.

DONGDONGTANG@tbk >create table t1 (a int, b varchar2(100));

Table created.

DONGDONGTANG@tbk > create index ix_a on t1(a);

Index created.
DONGDONGTANG@tbk > create index ix_b on t1(b);

Index created.

打开另一个会话,使用Tanel的会话活动跟踪器进行跟踪

SYS@tbk >@snapper.sql stat 120 1 user=DONGDONGTANG;

在原来的会话中执行insert 100万行数据

DONGDONGTANG@tbk >insert into t1
select level, substr('abcdefghbiklkmtnok',dbms_random.value(1,20),dbms_random.value(1,20)) ||trunc(dbms_random.value(1,1000))
from dual
connect by level<=1000000;

1000000 rows created.

DONGDONGTANG@tbk >commit;
Commit complete.

在会话活动跟踪器的窗口输出,我们观察 consistent gets指标

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
SID, USERNAME , TYPE, STATISTIC , DELTA, HDELTA/SEC, %TIME, GRAPH , NUM_WAITS, WAITS/SEC, AVERAGES
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

509, DONGDONGTANG , STAT, consistent gets , 26329, 219.02, , , , , 88.65 per execution

当使用先创建表的时候,导数据,再创建索引的方式,我们来看看结果如何

DONGDONGTANG@tbk >create table t1 (a int, b varchar2(100));

Table created.

DONGDONGTANG@tbk >insert into t1
select level, substr('abcdefghbiklkmtnok',dbms_random.value(1,20),dbms_random.value(1,20)) ||trunc(dbms_random.value(1,1000))
from dual
connect by level<=1000000; 2 3 4

1000000 rows created.

DONGDONGTANG@tbk >create index ix_a on t1(a);

Index created.

DONGDONGTANG@tbk > create index ix_b on t1(b);

Index created.

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
SID, USERNAME , TYPE, STATISTIC , DELTA, HDELTA/SEC, %TIME, GRAPH , NUM_WAITS, WAITS/SEC, AVERAGES
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
509, DONGDONGTANG , STAT, consistent gets , 12360, 102.8, , , , , 21.16 per execution

使用后一种方式,我们看到只进行了12360次consistent gets,相比前一种方式,减少将近一半左右. 所以我们在批量加载或导入数据的方式
尽量使用后一种方式来处理.这样会大大加快数据处理时间,正所谓磨刀不误砍柴功.

阅读(3744) | 评论(0) | 转发(0) |

上一篇：Oracle SQL Plan Baseline的实现方式

下一篇： Oracle LGWR进程跟踪

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6