Chinaunix首页 | 论坛 | 博客
  • 博客访问: 2017103
  • 博文数量: 148
  • 博客积分: 7697
  • 博客等级: 少将
  • 技术积分: 3071
  • 用 户 组: 普通用户
  • 注册时间: 2006-03-10 23:04
个人简介

MiBDP,数据开发、项目团队、数据应用和产品在路上,金融保险、互联网网游、电商、新零售行业、大数据和AI在路上。对数仓、模型、ETL、数据产品应用了解。DTCC 2013演讲嘉宾,曾做过两款大获好评的数据产品平台。知识星球ID:35863277

文章分类
文章存档

2020年(1)

2019年(2)

2017年(2)

2016年(5)

2015年(1)

2014年(1)

2013年(6)

2012年(5)

2011年(24)

2010年(28)

2009年(1)

2008年(6)

2007年(30)

2006年(36)

分类: Oracle

2010-09-27 17:06:48

  因为某些原因我们经常需要对一些超级大(BT)的表进行更新,项目这两天就有一个这样的需求,依据另外一张表的省ID关联更新另一张表的更新,原来觉得开并发后更新应该会快的,结果还是更新了近7个小时,后来还是受不了这个速度,google了下,终于找到一种超级快的方法:


alter table paysys_acnt_first_login_gatway nologging;(PS:其实这里的nologging是不起作用的)
alter session enable parallel dml;

update /*+ parallel(t1,4) */ paysys_acnt_first_login_gatway t1
   set province_id =
       (select province_id
          from paysys_account_login_log t2
         where t1.account_id = t2.account_id
           and t1.gateway_id = t2.gateway_id
           and t1.login_date = t2.login_date);
偶最开始的做法是用的上述办法,之所以没有使用下面的关联UPDATE,是因为分析了它与上述两个的执行计划,但从计划看上边无论从Cost,Cardinality还是Bytes都优于关联UPDATE
update (select /*+ bypass_ujvc */
         t1.province_id old_id, t2.province_id new_id
          from paysys_acnt_first_login_gatway t1,
               paysys_account_login_log t2
         where t1.account_id = t2.account_id
           and t1.gateway_id = t2.gateway_id
           and t1.login_date = t2.login_date) r
   set r.old_id = r.new_id;

如下是今天测试使用的,速度太夸张了247s就搞定了
declare
  maxrows number default 5000;
  row_id_table dbms_sql.Urowid_Table;
  p_id_table dbms_sql.Number_Table;
  cursor acnt_first_cur is
    select /*+ use_hash(t1,t2) parallel(t1,4) parallel(t2,4) */
     t2.province_id, t1.rowid
      from paysys_acnt_first_login_gatway t1, paysys_account_login_log t2
     where t1.account_id = t2.account_id
       and t1.gateway_id = t2.gateway_id
       and t1.login_date = t2.login_date
     order by t1.rowid;
begin
  open acnt_first_cur;
  loop
    exit when acnt_first_cur%notfound;
    fetch acnt_first_cur bulk collect
      into p_id_table, row_id_table limit maxrows;
    forall i in 1 .. row_id_table.count
      update paysys_acnt_first_login_gatway
         set province_id = p_id_table(i)
       where rowid = row_id_table(i);
    commit;
  end loop;
end;

另关于上述的大表UPDATE,ITPUB有个很热烈的讨论:http://www.itpub.net/thread-1052077-1-7.html应该也是上述方法的原始出处

阅读(4226) | 评论(0) | 转发(0) |
给主人留下些什么吧!~~