C++,python,热爱算法和机器学习
全部博文(1214)
分类: IT业界
2020-09-29 17:17:23
最近见到p-value的频率有点高,之前也看到很多次了,基本当时懂了过几天就忘记了,整理下。
P值定义[from:百度百科]
P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P < 0.05 为有统计学差异, P<0.01 为有显著统计学差异,P<0.001为有极其显著的统计学差异。其含义是样本间的差异由抽样误差所致的概率小于0.05 、0.01、0.001。实际上,P值不能赋予数据任何重要性,只能说明某事件发生的机率。
P值 |
碰巧的概率 |
对无效假设 |
统计意义 |
P>0.05 |
碰巧出现的可能性大于5% |
不能否定无效假设 |
两组差别无显著意义 |
P<0.05 |
碰巧出现的可能性小于5% |
可以否定无效假设 |
两组差别有显著意义 |
P <0.01 |
碰巧出现的可能性小于1% |
可以否定无效假设 |
两者差别有非常显著意义
|
P值的使用实例
实验考察一枚硬币是否均已。:
P:硬币是均匀的。
Q:在100次投掷中,得到90次正面,10次反面。
先说我们想证明什么?显然想证明硬币不均匀,把想证明的当作Ha,想证明的反面当作h0
在h0情况下得到Q(或者比Q更极端)的概率就是p-values,显然p-value越小,说明h0越“不靠谱”,也就是其反面ha(这里就是硬币不均匀)“相对更靠谱”。
所以p-value检验。思路上更类似“反证法”,但是不是严格逻辑反证,而是概率层面上的反证。通过假设出我们需要证明目标反面的情况。然后从情况推导出"出现最终观察现象"的概率非常低(5%)。就认为我们假设出的那个“证明目标反面的情况”不靠谱。从而证明“证明目标”是ok的。
参考:
P-Value P值的含义:http://www.cnblogs.com/emanlee/archive/2011/06/14/2080278.html