12c中的histogram一瞥-kerlion-ChinaUnix博客

kerlion的ChinaUnix博客kerlion.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

kerlion

博客访问： 1310824
博文数量： 127
博客积分： 2286
博客等级：大尉
技术积分： 1943
用户组：普通用户
注册时间： 2010-06-10 10:37

文章分类

全部博文（127）

Fusion Appl（1）
SSL（1）
NoSQL（5）
自动运维（3）
杂类（4）
SQL server（16）
虚拟化（1）
云（11）
存储（0）
UNIX（14）
MySQL（30）
Oracle（41）

internal（4）

shareplex（3）

Goldengate（1）
未分配的博文（0）

文章存档

2018年（1）

2015年（2）

2014年（1）

2013年（30）

2012年（88）

2011年（5）

我的朋友

相关博文

12c中的histogram一瞥

分类： Oracle

2013-12-10 18:10:47

12c发布后，很多大师都在研究histogram,但文章太长，讨论了许多细节，我来做个概述：

12c中新增加了2中类型的histogram:
1 Top Frequency Histogram， Frequency histogram的改进版
NDV的值虽然超过了bucket的数量，但是所占整体比例较小，干脆忽略掉。

2 Hybrid Histogram， Hight-Balance histogram的改进版，结合了Frequency histogram的特点，故叫混合直方图
Hight-Balance理解有点困难，而且不够精确；Hybrid的基本原则是每个值最多只用一个bucket，用Frequency的方法记录repeat count, 这就需要动态调整bucket的大小（西游记里面的神袋，有多少装多少），不再是过去的固定大小了。

如果搜集统计信息的时候指定了estimate_percent（准确地说不是auto_sample_size）, 则与以前一样，否则：
1 NDV < buckets, 则是Frequency histogram
2 NDV > buckets, 且top n的数据量超过标准：1-1/n, 则是Top Frequency histogram, n之外的NDV值被抛弃
3 NDV > buckets, 且Top n的数据量小于标准：1-1/n, 则是Hybrid Histogram

我也想把我以前写的脚本改进一下，初看了一下，改动很大，估计工作量不小，先看下概述吧：

至于详细的特点和选择率的计算，想研究一下，并且更新下我的脚本，由于要用到新的列，估计工作量不小，无法兼容12c以前的数据库了

[histogram一]显示histogram中列值的详细分布情况

阅读(2019) | 评论(1) | 转发(0) |

上一篇：有很多innodb很好的技术文章

下一篇：oracle12c中with function和with view怎么配合？

给主人留下些什么吧！~~

kerlion2013-12-11 13:56:55

昨天写的，今天就是推荐文章，版主很勤快吗！但是我更新下，就没了？

回复 | 举报

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6