Chinaunix首页 | 论坛 | 博客
  • 博客访问: 15516607
  • 博文数量: 112
  • 博客积分: 11195
  • 博客等级: 上将
  • 技术积分: 1989
  • 用 户 组: 普通用户
  • 注册时间: 2005-06-20 11:04
文章分类

全部博文(112)

文章存档

2013年(2)

2012年(27)

2011年(6)

2010年(11)

2009年(6)

2007年(7)

2006年(23)

2005年(30)

分类: 云计算

2012-06-19 14:32:25


离群数据的筛选可以使用下列方法

 

一、拉依达法

又称3倍标准偏差法,简称3S法。当某一测量数据与其测量结果的算术平均值之差大于3倍标准偏差时,
用公式表示为:

 
 
则该测量数据应舍弃。

 

二、肖维纳特法

以概率1/2n设定一判定范围(-KnSKnS),当偏差超出该范围时,就应该舍去。判别范围由下式确定:

 
 

 

 


Kn:肖维纳特系数与试验次数n有关。如下表:

 

肖维特系数                          2-0-1

n

Kn

n

Kn

n

Kn

n

Kn

n

Kn

n

Kn

3

1.38

8

1.86

13

2.07

18

2.20

23

2.30

50

2.58

4

1.53

9

1.92

14

2.12

19

2.22

24

2.31

75

2.71

5

1.65

10

1.96

15

2.13

20

2.24

25

2.33

100

2.81

6

1.73

11

2.00

16

2.15

21

2.26

30

2.39

200

3.02

7

1.80

12

2.03

17

2.17

22

2.28

40

2.49

500

3.20

 

因此肖维特法可疑数据舍弃的标准为:


 

 

 


三、格拉布斯法

Xi按值从小到大排列如下:

 


 

 

 









给出标准化顺序统计量g


最小值X1可疑,最大值Xn可疑,为:



 
 



格拉布斯法的判别标准为:g > g[n][p]


格拉布斯表——临界值GP(n)

P

n

0.95

0.99

P

n

0.95

0.99

3

1.135

1.155

17

2.475

2.785

4

1.463

1.492

18

2.504

2.821

5

1.672

1.749

19

2.532

2.854

6

1.822

1.944

20

2.557

2.884

7

1.938

2.097

21

2.580

2.912

8

2.032

2.231

22

2.603

2.939

9

2.110

2.323

23

2.624

2.963

10

2.176

2.410

24

2.644

2.987

11

2.234

2.485

25

2.663

3.009

12

2.285

2.550

30

2.745

3.103

13

2.331

2.607

35

2.811

3.178

14

2.371

2.659

40

2.866

3.240

15

2.409

2.705

45

2.914

3.292

16

2.443

2.747

50

2.956

3.336

阅读(11283) | 评论(1) | 转发(1) |
0

上一篇:simhash

下一篇:tlist配置

给主人留下些什么吧!~~

misserwell2014-02-10 11:50:03

\   ^__^
  \  (00)\______
     (__)\      )\/\
      ||---w |
   ||    ||