2013年(350)
分类: Oracle
2013-04-24 13:25:10
注:N表示数字型,C表示字符型,D表示日期型,[]表示内中参数可被忽略,fmt表示格式。
聚合函数可被用于select,order by以及having子句中。其运算可以基于group by的结果,也可以直接对所有记录进行运算。当然,这种类型语句相信大家平常也用的比较多,概念性的就不多介绍了,有一点需要注意的是,除了count和grouping之后,其它的统计运算均会忽略值为null的列。
注意,多数聚合函数都支持DISTINCT子句(distinct是什么?过滤记录集中重复记录用的),如果不指定则默认针对所有计录,举个最简单的例子:select count(col),count(distinct col) from tmp1。
本类函数中部分函数同时也属于分析函数。其做为分析函数时的具体用法将会在后面章节介绍,本节不做描述。
CUME_DIST(expr[,expr]...) WITHIN GROUP
(ORDER BY
expr [DESC | ASC] [NULLS {FIRST | LAST}]
[,expr [DESC | ASC] [NULLS {FIRST | LAST}]]...)非常有意思的一个函数。查询指定数值在指定分组序列中的相对位置,返回值是介于 0 和 1 之间的小数值。我们后面还会再讲几个相关的函数,均是实现类型功能,只是值的表现形式不同。
例如:SELECT CUME_DIST(120) WITHIN GROUP (ORDER BY value) FROM TMP1
GROUP_ID() 该函数必须配合group by子句使用。主要是用来区分group by 生成的记录集中是否是被重复生成的记录,如果该条记录是则返回1,否则返回0。
例如:SELECT t.col, group_id() FROM TMP1 t GROUP BY col, ROLLUP(col)
PERCENT_RANK ( expr [, expr]... ) WITHIN GROUP
( ORDER BY
expr [ DESC | ASC ] [NULLS { FIRST | LAST }]
[, expr [ DESC | ASC ] [NULLS { FIRST | LAST }]]...)本函数语法及形式与cume_dist非常相似,也是返回指定数据在指定分组序列中所占的相对位置,不过与cume_dist不同的是。不管指定值与分组序列中某值是否重复,均将此值视为序列一部分,而cume_dist则不同。如果指定值与分组序列中某值重复,则将二值视为一个值处理(上帝保佑,但愿俺讲明白了,废话不说,大家通过示例来理解吧)。
例如:SELECT PERCENT_RANK(120) WITHIN GROUP( ORDER BY value) FROM TMP1
PERCENTILE_CONT(n) WITHIN GROUP (ORDER BY col [DESC|ASC]) 根据输入值返回该值对应的分组序列中数值。输入值应该是介于0到1之间。原因请参照前面的PERCENT_RANK函数。
如果分组序列中没有存在对应值的话,会根据如下规则来计算返回值:
if (CRN = FRN = RN) then
(value of expression from row at RN)
else
(CRN - RN) * (value of expression for row at FRN) +
(RN - FRN) * (value of expression for row at CRN)
例如:
SELECT col, max(value), min(value), sum(value),
PERCENTILE_CONT(0.5) WITHIN GROUP(ORDER BY value) a,
PERCENTILE_CONT(0.8) WITHIN GROUP(ORDER BY value) b
FROM TMP1
group by col;
PERCENTILE_DISC(n) WITHIN GROUP (ORDER BY col [DESC|ASC]) 语法与形式与上例相同,不过在计算方法上略有差异。如果分组序列中没有对应值的话,那么将会返回该序列中最近最大的一个值。
相对而言,我认为某些情况下本函数被应用的机率还是相当大地,起码比上述几个函数的应用范围会广。
例如:
SELECT col, max(value), min(value),
PERCENTILE_DISC(0.5) WITHIN GROUP(ORDER BY value) a,
PERCENTILE_DISC(0.8) WITHIN GROUP(ORDER BY value) b
FROM TMP1
group by col;
STDDEV([DISTINCT|ALL] n) 该函数返回样本的标准偏差。
例如:SELECT col, STDDEV(value) FROM TMP1 GROUP BY col;
STDDEV_SAMP(n) 语法与形式与上同,其与STDDEV函数最大的区别是,如果该分组序列只有一行的话,则STDDEV_SAMP函数返回空值,而STDDEV则返回0。
例如:SELECT col, STDDEV(value),STDDEV_SAMP(value) FROM TMP1 GROUP BY col;
STDDEV_POP(n) 返回该分组序列总体标准偏差。
例如:SELECT col, STDDEV_POP(value) FROM TMP1 GROUP BY col;
VAR_POP(n) 该函数返回分组序列的总体方差,VAR_POP进行如下计算:(SUM(expr2) - SUM(expr)2 / COUNT(expr)) / COUNT(expr)。
例如:SELECT col, VAR_POP(value) FROM TMP1 GROUP BY col;
VAR_SAMP(n) 与上类似,该函数返回分组序列的样本方差,,其计算公式为:(SUM(expr2) - SUM(expr)2 / COUNT(expr)) / (COUNT(expr) - 1)。
例如:SELECT col, VAR_POP(value),VAR_SAMP(value) FROM TMP1 GROUP BY col;
VARIANCE(n) 该函数返回分组序列方差,Oracle计算该变量如下:
如果表达式中行数为1,则返回0,如果表达式中行数大于1,则返回VAR_SAMP
例如:SELECT col, VAR_SAMP(value),VARIANCE(value) FROM TMP1 GROUP BY col;