Chinaunix首页 | 论坛 | 博客
  • 博客访问: 131869
  • 博文数量: 37
  • 博客积分: 2010
  • 博客等级: 大尉
  • 技术积分: 375
  • 用 户 组: 普通用户
  • 注册时间: 2009-08-13 17:31
文章分类

全部博文(37)

文章存档

2011年(1)

2010年(9)

2009年(27)

我的朋友

分类: 数据库开发技术

2009-08-13 19:10:30

由于teradata share nothing的架构,就导致在经常需要执行重分布操作。
 
teradata中group by的机制是先在每个amp执行group by操作,然后执行总的group by操作,这样重复的数据就会在重分布前被过滤掉,并且如果每个重复的数据量多,需要进行重分布的量就会大大减少,从而大幅度提高性能。 反之,由于group by需要两次排重操作,如果重复的数据很少,性能就会很差。
 
相反,由于distinct仅在重分布之后进行排重操作,因此适合于重复量很少的去重操作。
阅读(683) | 评论(0) | 转发(0) |
0

上一篇:关于TD cast的学习

下一篇:TD多值压缩方法

给主人留下些什么吧!~~