首页　| 　博文目录　| 　关于我

博客访问： 1555062
博文数量： 465
博客积分： 8915
博客等级：中将
技术积分： 6365
用户组：普通用户
注册时间： 2010-07-30 15:05

文章分类

全部博文（465）

Mesos（2）
node.js（1）
司南阁（0）
TensorFlow（1）
运维（1）
JavaScript（2）
python（1）
Docker（1）
游戏（3）
Linux（1）
大数据（5）
互联网（1）
硬件安全（1）
iOS（2）
编程（1）
WebSocket（1）
编程（1）
架构（3）
Appium（1）
Spark（1）
Android（2）
Web前端（1）
IT图书（25）
操作系统（0）
操作系统（0）
网站数据分析（2）
大数据（9）
云计算（4）
编程技术（19）
开源技术（10）
非技术（5）
网络安全（8）
硬件（1）
未分配的博文（349）

文章存档

2017年（33）

2016年（2）

2015年（4）

2014年（29）

2013年（71）

2012年（148）

2011年（178）

我的朋友

贝叶斯定理

　　朴素贝叶斯是以贝叶斯定理为基础的概率分类模型。贝叶斯定理是概率论中的一个定理，它跟随机变量的条件概率及边缘概率分布有关。在有些关于概率的解说中，贝叶斯定理能够告知我们如何利用新证据修改已有的看法。这个名称来自于托马斯·贝叶斯。
　　通常，事件A在事件B（发生）的条件下的概率与事件B在事件A的条件下的概率是不一样的；然而，这两者有着确定的关系，贝叶斯定理就是对这种关系的表示。贝叶斯公式定义在事件B出现的前提下，事件A出现的概率等于事件A出现的前提下事件B发生的概率乘以时间A出现的概率再除以时间B出现的概率。通过联系事件A与事件B，计算从一个事件产生另一事件的概率,即从结果上溯原。因此，贝叶斯定理公式如下所示：
【图2】

　　在理解贝叶斯定理的基础上，可以较好地理解基于朴素贝叶斯的分类模型。信息分类是信息处理中最基本的模块，每一段信息无论长或短，都由若干特征组成，因此可以将所有特征视为一个向量集W=（w1，w2，w3，…，wn），其中wi即表示其中第i个特征。而信息的分类也可以视为一个分类标记的集合C={c1，c2，c3，…，cm}。在进行特征学习之前，特征wi与分类标记cj的关系不是确定值，因此需要提前计算P(C|W)，也就是在特征wi出现的情况下，信息属于分类标记C的概率，可根据贝叶斯计算，公式如下：
【图3】

　　因此，可以从信息分类的角度理解贝叶斯公式，即表示为：在特征wi出现的情况下是否是特征类别cj取决于在特征分类标记cj情况下特征wi出现的概率以及wi在所有特征中出现的概率。P(W)的意义在于如果这个特征在所有信息中出现，那么用特征wi去判定是否属于分类标识cj的概率越低，越不具备代表性。

车厘子与樱桃问题的解决

　　朴素贝叶斯是一种有监督的学习方式，可以利用伯努利模型（Bernoulli Model）以文件为粒度进行文本分类。
（有监督学习是有监督分类的实质，有监督分类是指根据已有的训练集提供的样本，通过不断计算，从样本中学习选择特征参数，对分类器建立判别函数以对被识别的样本进行分类。有监督分类方式可以有效利用先验数据，对后验数据进行校验，但是缺点也比较明显。首先，训练数据是人为收集，具有一定的主观性，并且人为收集数据也会导致花费一定的人力成本；其次，最终分类器分类的结果中，分类结果只可能是训练数据中的分类类型，不会产生新的类型。）
假设训练集样本的特征满足高斯分布，得到下表。
【图4】