基础知识：概率论中的PDF、CDF、PMF-hiyachen-ChinaUnix博客

架构师（云操作系统AI微服务）hiyachen.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

hiyachen

博客访问： 7161091
博文数量： 704
博客积分： 10821
博客等级：上将
技术积分： 12052
用户组：普通用户
注册时间： 2005-12-02 10:41

个人简介

中科院云平台架构师，专注于数字化、智能化，技术方向：云、Linux内核、AI、MES/ERP/CRM/OA、物联网、传感器、大数据、ML、微服务。

文章分类

全部博文（704）

云平台云计算（129）

未分类（0）

openstack（10）

分布式文件系统（3）

网络虚拟化（11）

容器云（1）

KVM-Libvirt（1）
大数据及数据挖掘（48）

spark（6）

算法（3）

hadoop（3）

mongodb（5）
Python（6）

python2（2）

python3（0）
linux-unix（72）

glusterrfs（8）

IPC（0）

文件系统（2）

AIX（1）

unix（34）
Java（170）

安全策略（4）

osgi（0）

AjAx（7）
数据库（70）

postgresql（0）

sqlite（0）

Redis(内存数据库（2）

Mysql（7）

Oracle_DB2_Sqlse（56）
Web（34）
网络与运维（19）

监控（3）
软件及系统架构（70）

金融（0）

移动开发（0）

UML（2）
中间件（2）

CICS（0）

Tuxedo（0）
C/C++（6）
PHP（3）
Others（19）

VBA||C#（3）

regExp（4）

Shell_Dos（5）
BPM（6）

JBPM（2）

工作流（4）
程序与人生（29）

Think（5）

Japan（3）
未分配的博文（21）

推荐博文

相关博文

基础知识：概率论中的PDF、CDF、PMF

分类：大数据

2019-02-22 09:28:27

一. 概念解释

    PDF：概率密度函数（probability density function）, 在数学中，连续型随机变量的概率密度函数（在不至于混淆时可以简称为密度函数）是一个描述这个随机变量的输出值，在某个确定的取值点附近的可能性的函数。

    PMF : 概率质量函数（probability mass function), 在概率论中，概率质量函数是离散随机变量在各特定取值上的概率。
    CDF : 累积分布函数 (cumulative distribution function)，又叫分布函数，是概率密度函数的积分，能完整描述一个实随机变量X的概率分布。

二. 数学表示

    PDF：如果X

是连续型随机变量，定义概率密度函数为fX(x)

，用PDF在某一区间上的积分来刻画随机变量落在这个区间中的概率，即
Pr(a≤X≤b)=∫bafX(x)dx

PMF：如果X
离散型随机变量，定义概率质量函数为fX(x)

,PMF其实就是高中所学的离散型随机变量的分布律,即
fX(x)=Pr(X=x)

比如对于掷一枚均匀硬币，如果正面令X=1，如果反面令X=0，那么它的PMF就是

fX(x)={12 if x∈{0,1}0 if x?{0,1}

CDF：不管是什么类型（连续/离散/其他）的随机变量，都可以定义它的累积分布函数，有时简称为分布函数。

对于连续型随机变量，显然有FX(x)=Pr(X≤x)=∫x?∞fX(t)dt
那么CDF就是PDF的积分，PDF就是CDF的导数。

对于离散型随机变量，其CDF是分段函数，比如举例中的掷硬币随机变量，它的CDF为
FX(x)=Pr(X≤x)=?????0 if x<012 if 0≤x<11 if x≥1

三.概念分析

　根据上述，我们能得到一下结论：

　１）PDF是连续变量特有的，PMF是离散随机变量特有的；
　２）PDF的取值本身不是概率，它是一种趋势（密度）只有对连续随机变量的取值进行积分后才是概率，也就是说对于连续值确定它在某一点的概率是没有意义的；
　３）PMF的取值本身代表该值的概率。
四.分布函数的意义

　　我们从两点来分析分布函数的意义：
　　
　　1.为什么需要分布函数？

    　　对于离散型随机变量，可以直接用分布律来描述其统计规律性，而对于非离散型的随机变量，如连续型随机变量，因为我们无法一一列举出随机变量的所有可能取值，所以它的概率分布不能像随机变量那样进行描述，于是引入PDF，用积分来求随机变量落入某个区间的概率。分布律不能描述连续型随机变量，密度函数不能描述离散随机变量，因此需要找到一个统一方式描述随机变量统计规律，这就有了分布函数。另外，在现实生活中，有时候人们感兴趣的是随机变量落入某个范围内的概率是多少，如掷骰子的数小于3点的获胜，那么考虑随机变量落入某个区间的概率就变得有现实意义了，因此引入分布函数很有必要。

　　2. 分布函数的意义

    　　分布函数F(x)

在点x处的函数值表示X落在区间(?∞,x]内的概率，所以分布函数就是定义域为R

    的一个普通函数，因此我们可以把概率问题转化为函数问题，从而可以利用普通的函数知识来研究概率问题，增大了概率的研究范围。

阅读(22475) | 评论(0) | 转发(0) |

上一篇：微服务架构-SpringCloud

下一篇：TIFF图像文件格式介绍

给主人留下些什么吧！~~

感谢所有关心和支持过ChinaUnix的朋友们

16024965号-6