AdaBoost Introduce-qhw-ChinaUnix博客

TITANICtitanic.blog.chinaunix.net

首页　| 　博文目录　| 　关于我

qhw

博客访问： 2324794
博文数量： 266
博客积分： 5485
博客等级：大校
技术积分： 3695
用户组：普通用户
注册时间： 2007-06-20 11:05

个人简介

多读书，多做事，广交朋友，趣味丛生

文章分类

全部博文（266）

模式识别（4）
机器学习（1）
移动安全（1）
产品设计（1）
思维改进（1）
网络编程（1）
云计算（16）
分布式/集群/负载（4）
Web开发（8）
团队管理（1）
软件工程（3）
营销管理（2）
设计模式（0）
操作系统（2）
Linux（24）

Ubuntu（6）
个人专区（3）
本科培训（9）
C && C++（8）
Database（26）
未分配的博文（151）

推荐博文

AdaBoost Introduce

分类：

2010-04-17 13:43:39

AdaBoost算法原理

AdaBoost算法针对不同的训练集训练同一个基本分类器（弱分类器），然后把这些在不同训练集上得到的分类器集合起来，构成一个更强的最终的分类器（强分类器）。理论证明，只要每个弱分类器分类能力比随机猜测要好，当其个数趋向于无穷个数时，强分类器的错误率将趋向于零。AdaBoost算法中不同的训练集是通过调整每个样本对应的权重实现的。最开始的时候，每个样本对应的权重是相同的，在此样本分布下训练出一个基本分类器h₁(x)。对于h₁(x)错分的样本，则增加其对应样本的权重；而对于正确分类的样本，则降低其权重。这样可以使得错分的样本突出出来，并得到一个新的样本分布。同时，根据错分的情况赋予h₁(x)一个权重，表示该基本分类器的重要程度，错分得越少权重越大。在新的样本分布下，再次对基本分类器进行训练，得到基本分类器h₂(x)及其权重。依次类推，经过T次这样的循环，就得到了T个基本分类器，以及T个对应的权重。最后把这T个基本分类器按一定权重累加起来，就得到了最终所期望的强分类器。