交通安全小常识简单的:什么是boosting方法

来源:百度文库 编辑:神马品牌网 时间:2024/04/29 22:35:31

Boosting 作为一种通用的学习算法,可以提高任一给定算法的性能。
Kearns and Valiant最先指出,在PAC学习模型中,若存在一个多项式级的学习算法来识别一组概念,并且识别率很高,那么这组概念是强可学习的;而如果学习算法识别一组概念的正确率仅比随机猜测的略好,那么这组概念是弱可学习的。
如果能将一个弱学习算法提升为强学习算法,那么在学习概念时,只要找到一个比随机猜测略好的弱学习算法,就可以将其提升为强学习算法,而不必直接去找通常情况下很难获得的强学习算法。
boosting中最基本的是adaboost,你要是弄清楚这个算法其他主要原理都差不多,只是实现手段或者说采用的数学公式不同。
它是这样的:先对所有样本辅以一个抽样权重(一般开始的时候权重都一样即认为均匀分布),在此样本上训练一个分类器对样本分类,这样可以得到这个分类器的误差率,我们根据它的误差率赋以一个权重,大体是误差越大权重就越小,针对这次分错的样本我们增大它的抽样权重。这样训练的下一个分类器就会侧重这些分错的样本,然后有根据它的误差率又计算权重,就这样依次迭代,最后我们得到的强分类器就是多个弱分类器的加权和.我们可以看出性能好的分类器权重大一些,这就体现了boosting的精髓。

Boosting 作为一种通用的学习算法,可以提高任一给定算法的性能。Kearns and Valiant最先指出,在PAC学习模型中,若存在一个多项式级的学习算法来识别一组概念,并且识别率很高,那么这组概念是强可学习的;而如果学习算法识别一组概念的正确率仅比随机猜测的略好,那么这组概念是弱可学习的。如果能将一个弱学习算法提升为强学习算法,那么在学习概念时,只要找到一个比随机猜测略好的弱学习算法,就可以将其提升为强学习算法,而不必直接去找通常情况下很难获得的强学习算法 。

再给你个官方网站:http://www.boosting.org/