应该如何理解概率分布函数和概率密度函数？-LaoLiulaoliu-ChinaUnix博客

miraclemiracle.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

laoliulaoliu

博客访问： 4625900
博文数量： 1214
博客积分： 13195
博客等级：上将
技术积分： 9105
用户组：普通用户
注册时间： 2007-01-19 14:41

个人简介

C++,python,热爱算法和机器学习

文章分类

全部博文（1214）

cloud（3）
operation（9）
tornado（4）
mac_os（1）
golang（4）
架构（13）
git（4）
security（29）
shell（1）
macbook（1）
ruby（13）
javascript（15）
design（3）
testing（1）
mac（1）
bigdata（69）
nosql（46）
R（9）
gcj/acm（6）
NLP（10）
小说（3）
matlab（4）
web（44）
java（66）
product（7）
c#（1）
language（4）
machine learning（76）
science（4）
opencourse（2）
windows（3）
search（33）
algorithm（65）
database（51）
compiler（11）
ACE（5）
poem（1）
programming（29）
python（140）
assembly（1）
linux（49）
C++（16）
book（2）
cate（1）
phliosophy（3）
mental（30）
Science fiction（1）
Software（5）
c（23）
network（65）
CS（15）
thinking（10）
BSD（13）
solaris10（2）
life（57）
Debian（16）
economy（7）
Mathematics（57）
OS（8）
ibm（2）
gentoo（32）
未分配的博文（8）

文章存档

2021年（13）

2020年（49）

2019年（14）

2018年（27）

2017年（69）

2016年（100）

2015年（106）

2014年（240）

2013年（5）

2012年（193）

2011年（155）

2010年（93）

2009年（62）

2008年（51）

2007年（37）

我的朋友

先从离散型随机变量和连续性随机变量说起

对于如何分辨离散型随机变量和连续性随机变量，我这里先给大家举几个例子：

1、一批电子元件的次品数目。

2、同样是一批电子元件，他们的寿命情况。

在第一个例子中，电子元件的次数是一个在现实中可以区分的值，我们用肉眼就能看出，这一堆元件里，次品的个数。但是在第二个例子中，这个寿命它是一个你无法用肉眼数的过来的数字，它需要你用笔记下来，变成一个数字你才能感受它。在这两个例子中，第一例子涉及的随机变量就是离散型随机变量，第二个涉及的变量就是连续型随机变量。

在贾俊平老师的《统计学》教材中，给出了这样的区分：

如果随机变量的值可以都可以逐个列举出来，则为离散型随机变量。如果随机变量X的取值无法逐个列举则为连续型变量。

我始终觉得，贾老师这么说，对于我们这些脑子笨又爱钻牛角尖的学生来说，还是不太好理解。所以我就告诉大家一个不一定非常严谨，但是绝对好区分的办法。

只要是能够用我们日常使用的量词可以度量的取值，比如次数，个数，块数等都是离散型随机变量。只要无法用这些量词度量，且取值可以取到小数点2位，3位甚至无限多位的时候，那么这个变量就是连续型随机变量！

对了，如果你连随机变量这个概念还不理解的话，我送你一句贾俊平老师的话：

如果微积分是研究变量的数学，那么概率论与数理统计是研究随机变量的数学。

再来理解离散型随机变量的概率分布，概率函数和分布函数

在理解概率分布函数和概率密度函数之前，我们先来看看概率分布和概率函数是咋回事。一下子又冒出来两个长得差不多的概念！没事，他们长得差不多，实际代表的含义其实也差不多！

在讲概率函数和概率分布之前，我想先讲讲为什么我们花这么大的力气去研究这个概念。因为它实在太重要了，为什么呢？在这里，我直接引用陈希孺老师在他所著的《概率论与数理统计》这本书中说的：

研究一个随机变量，不只是要看它能取哪些值，更重要的是它取各种值的概率如何！

这句是本文的核心内容，你要牢牢记得，我们这篇文章里的所有概念都在是描述一件东西，那就是概率！概率！概率！什么概率密度啦，概率分布啦，概率函数啦，都是在描述概率！

概率分布和概率函数这两个概念，我想先从概率函数开始讲。概率函数，就是用函数的形式来表达概率。

pi=P(X=ai)(i=1,2,3,4,5,6)

在这个函数里，自变量（X）是随机变量的取值，因变量（pi）是取值的概率。这就叫啥，这叫用数学语言来表示自然现象！它就代表了每个取值的概率，所以顺理成章的它就叫做了X的概率函数。从公式上来看，概率函数一次只能表示一个取值的概率。比如P（X=1）=1/6,这代表用概率函数的形式来表示，当随机变量取值为1的概率为1/6，一次只能代表一个随机变量的取值。

接下来讲概率分布，顾名思义就是概率的分布，这个概率分布还是讲概率的。我认为在理解这个概念时，关键不在于“概率”两个字，而在于“分布”这两个字。为了理解“分布”这个词，我们来看一张图。

离散型随机变量的值和概率的分布列表

在很多教材中，这样的列表都被叫做离散型随机变量的“概率分布”。其实严格来说，它应该叫“离散型随机变量的值分布和值的概率分布列表”，这个名字虽然比“概率分布”长了点，但是对于我们这些笨学生来说，肯定好理解了很多。因为这个列表，上面是值，下面是这个取值相应取到的概率，而且这个列表把所有可能出现的情况全部都列出来了！

举个例子吧，一颗6面的骰子，有1，2，3，4，5，6这6个取值，每个取值取到的概率都为1/6。那么你说这个列表是不是这个骰子取值的”概率分布“？

长得挺像的，上面是取值，下面是概率，这应该就是骰子取值的“概率分布”了吧！大错特错！少了一个最重要的条件！对于一颗骰子的取值来说，它列出的不是全部的取值，把6漏掉了!

这么一说你就应该明白概率分布是个什么鬼了吧。说完概率分布，就该说说分布函数了。这个分布函数又是个简化版的东西！我真的很讨厌我们的教材中老是故弄玄虚，卖弄概念！你就老老实实的写成”概率分布函数“，让我们这些笨学生好理解一些不行吗？

看看下图中的分布律！这又是一个不统一叫法的丑恶典型！这里的分布律明明就是我们刚刚讲的“概率函数”，完全就是一个东西嘛！但是我知道很多教材就是叫分布律的。

概率分布函数就是把概率函数累加

我们来看看图上的公式，其中的F(x)就代表概率分布函数啦。这个符号的右边是一个长的很像概率函数的公式，但是其中的等号变成了大于等于号的公式。你再往右看看，这是一个一个的概率函数的累加！发现概率分布函数的秘密了吗？它其实根本不是个新事物，它就是概率函数取值的累加结果！所以它又叫累积概率函数！其实，我觉得叫它累积概率函数还更好理解！！

概率函数和概率分布函数就像是一个硬币的两面，它们都只是描述概率的不同手段！

连续型随机变量也有“概率函数”和“概率分布函数”吗？

有！连续型随机变量也有它的“概率函数”和“概率分布函数”，但是连续型随机变量的“概率函数”换了一个名字，叫做“概率密度函数”！为啥要这么叫呢？我们还是借用大师的话来告诉你，在陈希孺老师所著的《概率论与数理统计》这本书中，

如果这么解析你还是不太懂的话，看看下面的这个公式：

概率密度函数用数学公式表示就是一个定积分的函数，定积分在数学中是用来求面积的，而在这里，你就把概率表示为面积即可！

左边是F(x)连续型随机变量分布函数画出的图形，右边是f(x)连续型随机变量的概率密度函数画出的图像，它们之间的关系就是，概率密度函数是分布函数的导函数。

两张图一对比，你就会发现，如果用右图中的面积来表示概率，利用图形就能很清楚的看出，哪些取值的概率更大！这样看起来是不是特别直观，特别爽！！所以，我们在表示连续型随机变量的概率时，用f(x)概率密度函数来表示，是非常好的！

这篇文章只是我个人对于这些概念的一些比较取巧的理解，如果你想更加深刻，精确的理解这些概念，我推荐大家读一下陈希孺老师的《概率论与数理统计》这本书，这本书对于这些概念的理解非常有帮助！

作者：产品经理马忠信
链接：
来源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

阅读(1005) | 评论(0) | 转发(0) |

上一篇：逻辑回归（Logistic Regression）

下一篇：基础系列1：先验概率 & 后验概率

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6