大批量数据迁移-sjqy5753-ChinaUnix博客

数据迁移

首页　| 　博文目录　| 　关于我

sjqy5753

博客访问： 338642
博文数量： 282
博客积分： 10010
博客等级：上将
技术积分： 3260
用户组：普通用户
注册时间： 2008-07-26 14:38

文章分类

全部博文（282）

未分配的博文（282）

文章存档

2011年（1）

2008年（281）

我的朋友

相关博文

大批量数据迁移

分类：服务器与存储

2008-07-28 20:39:58

机器配置:IBM P690 6U12G
数据库版本: Oracle 9.2.0.6

需求: 根据主外键关系迁移tb1446表内数据至tb1446_copy

表tb1446内有20个Hash分区,根据分区结合bulk collect技术,一次提交25000条记录(需要测试后得出

一次提交的记录数)，使得整个单表迁移过程耗时最短.
而且最重要的是可以保证undo不会被大事务搞的七零八乱.

代码:
SQL>select count(*)from ecifupdate.tb1446; COUNT(*) ---------- 7087611 SQL>select count(*)from ecifupdate.tb1560; COUNT(*) ---------- 74735643 编写bulk collect方式的存储过程. migration_tb1446_part_00 migration_tb1446_part_01 migration_tb1446_part_02 migration_tb1446_part_03 . . . migration_tb1446_part_19 给个sample参考(待完善) createorreplace procedure migration_tb1446_part_00 is type tb_bulk_type is table of tb1446_copy%rowtype; ref_bulk tb_bulk_type; Cursor c_bulk is select a.* from ecifupdate.tb1446 partition(part_00)a, ecifupdate.tb1560 b where a.arrangement_id=b.linkedarrangement; begin open c_bulk; loop fetch c_bulk bulk collect into ref_bulk limit 25000; forall i in 1..ref_bulk.count insert into tb1446_copy values ref_bulk(i); exitwhen c_bulk%notfound; end loop; close c_bulk; end; 单个进程执行一个hash分区的耗时是00:01:16.68 SQL>exec migration_tb1446_part_00; PL/SQL procedure successfully completed. Elapsed:00:01:16.68 考虑资源配置(cpu,i/o)可以采用并行方式处理. 我这里四个进程并行处理20个分区总共耗时7分17秒完成. 迁移后tb1446_copy表记录数 SQL>select count(*)from tb1446_copy; COUNT(*) ---------- 2890208 这里要说明一点: a.arrangement_id=b.linkedarrangement必须是主外键连接才能保证tb1446_copy表内没有重复数据

阅读(332) | 评论(0) | 转发(0) |

上一篇：存储分析:解决企业数据迁移难题的新方法

下一篇：数据迁移解决方案

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6