分类:
2010-04-29 08:06:54
最大似然法(the method of maximum likelihood)也称极大似然法,它最早是由高斯所提出的,后来由英国统计学家费歇于1912年在其一篇文章中重新提出,并且证明了这个方法的一些性质.最大似然估计这一名称也是费歇给的.它是建立在最大似然原理的基础上的一个统计方法.为了对最大似然原理有一个直观的认识,我们先来看一个例子.
例 设有外形完全相同的两个箱子,甲箱有99个白球1个黑球,乙箱有1个白球99个黑球.今随机地抽取一箱,然后再从这箱中任取一球,结果发现是白球.问这个箱子是甲箱还是乙箱?
分析
但是在实际生活中,如果都要按照逻辑推断来思考,那么将会给你的生活带来很大的麻烦。比如出门,则难免会有一定的概率出一定的意外,因此所谓“安全回家”在逻辑上便不再是绝对可靠的,故而你只能选择闭门不出。
回到刚才的例题。
现在的问题是,仅仅从取出的球是白球这一点是无法从逻辑上严格加以判定该箱究竟是甲箱还是乙箱的。但是如果现在一定要我们做出选择,那么我们只能这样来考虑:从箱中取出的球是白球这一点来看,甲箱和乙箱哪个看上去更像是真正从中取球的箱子?
我们这样来分析:如果该箱是甲箱,则取得白球的概率为0.99;如果该箱是乙箱,则取得白球的概率0.01.因此,用“该箱是甲箱”来解释所取的球是白球这一事件更有说服力一些,从而我们判定甲箱比乙箱更像一些。最后我们做出推断,这球是从甲箱取出的.
其实,如果我们从“最大似然”的原文maximum likelihood来看,就会发现这个名称的原始含义就是“看起来最像”的意思。
“看起来最像”,在很多情况下其实就是我们决策时的依据。
一个总体往往都有若干个重要的参数。比如,对于正态总体来说,均值和方差就是两个非常重要的参数。但是在很多情况下,这些参数往往是不知道的,这就需要我们利用抽样所得的部分数据来做统计推断。
假设我们现在获得了一组数据,记为x,我们需要做的是,利用x中所包含的信息来推断总体中的未知参数值。显然,未知参数是有其取值的范围的,我们现在要做的是,在参数可能的取值范围内寻找到一个“看起来最像”的那个值来作为未知参数的估计值。
那么,在这里“看起来最像”在数学上的含义是什么呢?
现在,假设有甲乙两支足球队要进行比赛,某老汉很认真地看了这两支足球队的相关资料,并作了细致的分析,得出了甲队战胜乙队的概率为p。但是在第二天被朋友问及此事时,该老汉一时犯昏把数字给记混了。他只知道甲队战胜乙队的概率p只可能取如下几个值0,0.1,0.3,0.5,0.75,0.9,但一点也记不清到底哪个数字才是真实的。也就是说,在这个时候,这五个数字没有哪一个看上去更像是真实的p。于是他开始翻看随身携带的一些资料,发现与这两支足球队有关的资料只有一条,这就是他们在某日的比赛中以平局收场。
看完这条资料以后,老汉再来看以上这六个数字时,发现0.5看起来最像,因为用0.5来解释刚才看到的资料最有说服力。
如果老汉看到的资料中说甲队在某日的比赛中战胜了乙队,那么此时0.9将是看起来最像的。
数理统计是数学的一个分支,所使用的数学工具比较高级且显得比较抽象,但是从我们以上的分析来看,它所基于的最基本的思想仍然是来源于我们现实生活中的一些很常见的推断法则,只不过在很多的时候我们在以这样的法则做出推断时并没被我们意识到而已。