ORACLE函数介绍第四篇非著名函数之聚合函数-junsansi-ChinaUnix博客

junsansi的ChinaUnix博客

首页　| 　博文目录　| 　关于我

junsansi

博客访问： 1262946
博文数量： 350
博客积分： 10
博客等级：民兵
技术积分： 5668
用户组：普通用户
注册时间： 2011-03-23 17:53

文章分类

全部博文（350）

原创笔记（271）
Hadoop实践（8）
NOSQL（1）
mysql数据库（38）
mysql数据库（0）
涂抹ORACLE（32）
未分配的博文（0）

文章存档

2013年（350）

我的朋友

相关博文

ORACLE函数介绍第四篇非著名函数之聚合函数

分类： Oracle

2013-04-24 13:25:10

oracle函数介绍(4) 非著名函数之聚合函数(含如下函数介绍)：
CUME_DIST
GROUP_ID
PERCENT_RANK
PERCENTILE_CONT
PERCENTILE_DISC
STDDEV
STDDEV_SAMP
STDDEV_POP
VAR_POP
VAR_SAMP
VARIANCE

注：N表示数字型，C表示字符型，D表示日期型，[]表示内中参数可被忽略，fmt表示格式。

　　聚合函数可被用于select,order by以及having子句中。其运算可以基于group by的结果，也可以直接对所有记录进行运算。当然，这种类型语句相信大家平常也用的比较多，概念性的就不多介绍了，有一点需要注意的是，除了count和grouping之后，其它的统计运算均会忽略值为null的列。

　　注意，多数聚合函数都支持DISTINCT子句(distinct是什么？过滤记录集中重复记录用的)，如果不指定则默认针对所有计录，举个最简单的例子：select count(col),count(distinct col) from tmp1。
　　本类函数中部分函数同时也属于分析函数。其做为分析函数时的具体用法将会在后面章节介绍，本节不做描述。

CUME_DIST(expr[,expr]...) WITHIN GROUP
(ORDER BY
expr [DESC | ASC] [NULLS {FIRST | LAST}]
[,expr [DESC | ASC] [NULLS {FIRST | LAST}]]...)非常有意思的一个函数。查询指定数值在指定分组序列中的相对位置，返回值是介于 0 和 1 之间的小数值。我们后面还会再讲几个相关的函数，均是实现类型功能，只是值的表现形式不同。
例如：SELECT CUME_DIST(120) WITHIN GROUP (ORDER BY value) FROM TMP1

GROUP_ID() 该函数必须配合group by子句使用。主要是用来区分group by 生成的记录集中是否是被重复生成的记录，如果该条记录是则返回1，否则返回0。
例如：SELECT t.col, group_id() FROM TMP1 t GROUP BY col, ROLLUP(col)

PERCENT_RANK ( expr [, expr]... ) WITHIN GROUP
( ORDER BY
expr [ DESC | ASC ] [NULLS { FIRST | LAST }]
[, expr [ DESC | ASC ] [NULLS { FIRST | LAST }]]...)本函数语法及形式与cume_dist非常相似，也是返回指定数据在指定分组序列中所占的相对位置，不过与cume_dist不同的是。不管指定值与分组序列中某值是否重复，均将此值视为序列一部分，而cume_dist则不同。如果指定值与分组序列中某值重复，则将二值视为一个值处理(上帝保佑，但愿俺讲明白了，废话不说，大家通过示例来理解吧)。
例如：SELECT PERCENT_RANK(120) WITHIN GROUP( ORDER BY value) FROM TMP1

PERCENTILE_CONT(n) WITHIN GROUP (ORDER BY col [DESC|ASC]) 根据输入值返回该值对应的分组序列中数值。输入值应该是介于0到1之间。原因请参照前面的PERCENT_RANK函数。
如果分组序列中没有存在对应值的话，会根据如下规则来计算返回值：
if (CRN = FRN = RN) then
(value of expression from row at RN)
else
(CRN - RN) * (value of expression for row at FRN) +
(RN - FRN) * (value of expression for row at CRN)

例如：
SELECT col, max(value), min(value), sum(value),
PERCENTILE_CONT(0.5) WITHIN GROUP(ORDER BY value) a,
PERCENTILE_CONT(0.8) WITHIN GROUP(ORDER BY value) b
FROM TMP1
group by col;

PERCENTILE_DISC(n) WITHIN GROUP (ORDER BY col [DESC|ASC]) 语法与形式与上例相同，不过在计算方法上略有差异。如果分组序列中没有对应值的话，那么将会返回该序列中最近最大的一个值。

相对而言，我认为某些情况下本函数被应用的机率还是相当大地，起码比上述几个函数的应用范围会广。

例如：
SELECT col, max(value), min(value),
PERCENTILE_DISC(0.5) WITHIN GROUP(ORDER BY value) a,
PERCENTILE_DISC(0.8) WITHIN GROUP(ORDER BY value) b
FROM TMP1
group by col;

STDDEV([DISTINCT|ALL] n) 该函数返回样本的标准偏差。
例如：SELECT col, STDDEV(value) FROM TMP1 GROUP BY col;

STDDEV_SAMP(n) 语法与形式与上同，其与STDDEV函数最大的区别是，如果该分组序列只有一行的话，则STDDEV_SAMP函数返回空值，而STDDEV则返回0。
例如：SELECT col, STDDEV(value),STDDEV_SAMP(value) FROM TMP1 GROUP BY col;

STDDEV_POP(n) 返回该分组序列总体标准偏差。
例如：SELECT col, STDDEV_POP(value) FROM TMP1 GROUP BY col;

VAR_POP(n) 该函数返回分组序列的总体方差，VAR_POP进行如下计算：(SUM(expr2) - SUM(expr)2 / COUNT(expr)) / COUNT(expr)。
例如：SELECT col, VAR_POP(value) FROM TMP1 GROUP BY col;

VAR_SAMP(n) 与上类似，该函数返回分组序列的样本方差，，其计算公式为：(SUM(expr2) - SUM(expr)2 / COUNT(expr)) / (COUNT(expr) - 1)。
例如：SELECT col, VAR_POP(value),VAR_SAMP(value) FROM TMP1 GROUP BY col;

VARIANCE(n) 该函数返回分组序列方差，Oracle计算该变量如下：
如果表达式中行数为1，则返回0，如果表达式中行数大于1，则返回VAR_SAMP
例如：SELECT col, VAR_SAMP(value),VARIANCE(value) FROM TMP1 GROUP BY col;

阅读(634) | 评论(0) | 转发(0) |

上一篇：ORACLE函数介绍第三篇著名函数之聚合函数

下一篇：ORACLE函数介绍第五篇分析函数简述

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6