分类: 云计算
2012-06-19 14:32:25
离群数据的筛选可以使用下列方法
一、拉依达法
又称3倍标准偏差法,简称3S法。当某一测量数据与其测量结果的算术平均值之差大于3倍标准偏差时,
二、肖维纳特法
以概率1/2n设定一判定范围(-KnS,KnS),当偏差超出该范围时,就应该舍去。判别范围由下式确定:
肖维特系数 表2-0-1
n | Kn | n | Kn | n | Kn | n | Kn | n | Kn | n | Kn |
3 | 1.38 | 8 | 1.86 | 13 | 2.07 | 18 | 2.20 | 23 | 2.30 | 50 | 2.58 |
4 | 1.53 | 9 | 1.92 | 14 | 2.12 | 19 | 2.22 | 24 | 2.31 | 75 | 2.71 |
5 | 1.65 | 10 | 1.96 | 15 | 2.13 | 20 | 2.24 | 25 | 2.33 | 100 | 2.81 |
6 | 1.73 | 11 | 2.00 | 16 | 2.15 | 21 | 2.26 | 30 | 2.39 | 200 | 3.02 |
7 | 1.80 | 12 | 2.03 | 17 | 2.17 | 22 | 2.28 | 40 | 2.49 | 500 | 3.20 |
因此肖维特法可疑数据舍弃的标准为:
三、格拉布斯法
将Xi按值从小到大排列如下:
给出标准化顺序统计量g:
最小值X1可疑,最大值Xn可疑,为:
格拉布斯法的判别标准为:g > g[n][p]
格拉布斯表——临界值GP(n)
P n | 0.95 | 0.99 | P n | 0.95 | 0.99 |
3 | 1.135 | 1.155 | 17 | 2.475 | 2.785 |
4 | 1.463 | 1.492 | 18 | 2.504 | 2.821 |
5 | 1.672 | 1.749 | 19 | 2.532 | 2.854 |
6 | 1.822 | 1.944 | 20 | 2.557 | 2.884 |
7 | 1.938 | 2.097 | 21 | 2.580 | 2.912 |
8 | 2.032 | 2.231 | 22 | 2.603 | 2.939 |
9 | 2.110 | 2.323 | 23 | 2.624 | 2.963 |
10 | 2.176 | 2.410 | 24 | 2.644 | 2.987 |
11 | 2.234 | 2.485 | 25 | 2.663 | 3.009 |
12 | 2.285 | 2.550 | 30 | 2.745 | 3.103 |
13 | 2.331 | 2.607 | 35 | 2.811 | 3.178 |
14 | 2.371 | 2.659 | 40 | 2.866 | 3.240 |
15 | 2.409 | 2.705 | 45 | 2.914 | 3.292 |
16 | 2.443 | 2.747 | 50 | 2.956 | 3.336 |