teradata排重操作符选择group by vs distinct-aqcjsy1-ChinaUnix博客

分布式架构设计与系统优化

首页　| 　博文目录　| 　关于我

aqcjsy1

博客访问： 1236251
博文数量： 398
博客积分： 10110
博客等级：上将
技术积分： 4055
用户组：普通用户
注册时间： 2007-12-23 20:01

个人简介

新博客http://www.cnblogs.com/zhjh256 欢迎访问

文章分类

全部博文（398）

db2学习（4）
2008-1（63）

Oracle管理（31）

Error Message（7）

PL/SQL（24）
Oracle（90）
未分配的博文（241）

文章存档

2012年（1）

2011年（41）

2010年（16）

2009年（98）

2008年（142）

2007年（100）

我的朋友

相关博文

teradata排重操作符选择group by vs distinct

分类：数据库开发技术

2009-06-09 15:07:37

由于teradata share nothing的架构，就导致在经常需要执行重分布操作。

teradata中group by的机制是先在每个amp执行group by操作，然后执行总的group by操作，这样重复的数据就会在重分布前被过滤掉，并且如果每个重复的数据量多，需要进行重分布的量就会大大减少，从而大幅度提高性能。反之，由于group by需要两次排重操作，如果重复的数据很少，性能就会很差。

相反，由于distinct仅在重分布之后进行排重操作，因此适合于重复量很少的去重操作。

上述推断可以从expalin看出，如下：

SELECT DISTINCT Bil_User_Type_Cd FROM BSSDATA.NET_CDR_VS_O_B_TMP ;

Step  Est. Time Actual Time Est. Rows Actual Rows Step Text
1  0:00.00 0:00.00 0 1 First, lock BSSDATA                       ."pseudo table" for read on a row hash.
2  0:00.00 0:00.00 0 142 Next, we lock BSSDATA                       .NET_CDR_VS_O_B_TMP             for read.
3  0:35.17  79760690  We do an All-AMPs RETRIEVE step from BSSDATA                       .NET_CDR_VS_O_B_TMP             by way of an all-rows scan into Spool 39689, which is redistributed by hash code to all AMPs.
4  0:00.00  0  We send out an END TRANSACTION step to all AMPs involved in processing the request.
----------------------------------------------------------

SEL Bil_User_Type_Cd FROM BSSDATA.NET_CDR_VS_O_B_TMP
GROUP BY 1

1  0:00.00 0:00.00 0 1 First, lock BSSDATA                       ."pseudo table" for read on a row hash.
2  0:00.00 0:00.01 0 142 Next, we lock BSSDATA                       .NET_CDR_VS_O_B_TMP             for read.
3  0:05.93  8930  We do a SUM step to aggregate from BSSDATA                       .NET_CDR_VS_O_B_TMP             by way of an all-rows scan. Aggregate Intermediate Results are computed globally, then placed in Spool 39695.
4  0:00.01  8930  We do an All-AMPs RETRIEVE step from Spool 39695 (Last Use) by way of an all-rows scan into Spool 39693, which is built locally on the AMPs.
5  0:00.00  0  We send out an END TRANSACTION step to all AMPs involved in processing the request.

阅读(1306) | 评论(0) | 转发(0) |

上一篇：sql server安装错误

下一篇：无法打开用户默认数据库。登录失败。解决方法

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6