Group by和distinct的区别-typot-ChinaUnix博客

Typot的博客

首页　| 　博文目录　| 　关于我

typot

博客访问： 137992
博文数量： 37
博客积分： 2010
博客等级：大尉
技术积分： 375
用户组：普通用户
注册时间： 2009-08-13 17:31

文章分类

全部博文（37）

ORACLE（0）
银行业务（0）
日志随想（3）
Java学习（1）
ETL（1）
Shell（0）
Perl（1）
Teradata学习（30）
未分配的博文（1）

文章存档

2011年（1）

2010年（9）

2009年（27）

我的朋友

相关博文

Group by和distinct的区别

分类：数据库开发技术

2009-08-13 19:10:30

由于teradata share nothing的架构，就导致在经常需要执行重分布操作。

teradata中group by的机制是先在每个amp执行group by操作，然后执行总的group by操作，这样重复的数据就会在重分布前被过滤掉，并且如果每个重复的数据量多，需要进行重分布的量就会大大减少，从而大幅度提高性能。反之，由于group by需要两次排重操作，如果重复的数据很少，性能就会很差。

相反，由于distinct仅在重分布之后进行排重操作，因此适合于重复量很少的去重操作。

阅读(735) | 评论(0) | 转发(0) |

上一篇：关于TD cast的学习

下一篇：TD多值压缩方法

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6