Adaboost的python实现

1.介绍
Adaboost是一种迭代算法，其核心思想是针对同一个训练集训练不同的分类器（弱分类器），然后把这些弱分类器集合起来，构成一个更强的最终分类器（强分类器）

2.算法逻辑
1、先通过对N个训练样本的学习得到第一个弱分类器； 2、将分错的样本和其他的新数据一起构成一个新的N个的训练样本，通过对这个样本的学习得到第二个弱分类器； 3、将1和2都分错了的样本加上其他的新样本构成另一个新的N个的训练样本，通过对这个样本的学习得到第三个弱分类器 4、最终经过提升的强分类器。即某个数据被分为哪一类要由各分类器权值决定。

3.实现（参考西瓜书及机器学习实战）

#adaBoost实现
def adaBoostTrain(dataArr,classLabels,numIt=40):
    weakClassArr = []
    m = np.shape(dataArr)[0]
    D = np.mat(np.ones((m,1))/m)   #初始化权重，每个feature都一样
    aggClassEst = np.mat(np.zeros((m,1)))
    #唯一的入参是迭代次数，要么error为 0跳出循环 ，要么循环次数达到numIt 的时候跳出循环
    for i in range(numIt):
        # 决策树桩算法，也可以换成其他的算法
        bestStump,error,classEst = buildStump(dataArr,classLabels,D)
        #print "D:",D.T
        alpha = float(0.5*np.log((1.0-error)/max(error,1e-16)))#计算alpha值
        bestStump['alpha'] = alpha  
        weakClassArr.append(bestStump)
        #print "classEst: ",classEst.T
        #重新计算权重
        expon = np.multiply(-1*alpha*np.mat(classLabels).T,classEst)
        D = np.multiply(D,np.exp(expon))
        D = D/D.sum()
        aggClassEst += alpha*classEst
        aggErrors = np.multiply(np.sign(aggClassEst) != np.mat(classLabels).T,np.ones((m,1)))
        errorRate = aggErrors.sum()/m
        print "total error: ",errorRate
        if errorRate == 0.0: break
        print "weakClassArr:",weakClassArr
        print "aggClassEst:", aggClassEst

    return weakClassArr,aggClassEst

Adaboost的python实现

pythonxuexi

相关推荐

集成学习之AdaBoost算法

机器学习：集成算法 - bagging、boosting、adaboost

【ML-6-2】集成学习-boosting（Adaboost和GBDT ）

谈谈模型融合之三 —— GBDT

机器学习——Boosting算法与Adaboost算法

提升树之Adaboost算法的介绍

随机森林在sklearn中的实现

【数据科学系统学习】机器学习算法 # 西瓜书学习记录 [12] 集成学习实践

机器学习实战_集成学习（一）

如何用OpenCV在Python中实现人脸检测

机器学习-Boosting算法

机器学习中最最好用的提升方法：Boosting 与 AdaBoost

AdaBoost vs KNearest Neighbors vs支持向量分类器

机器学习算法在自动驾驶汽车中扮演怎样的角色

Python基于OpenCV库Adaboost实现人脸识别功能详解

纯干货|Boosting家族之GBDT

机器不学习：机器学习时代的三大神器:GBDT,XGBOOST和LightGBM

今日头条量化分析：机器学习因子有效性分析

机器学习算法在自动驾驶领域的应用大盘点

机器学习算法在自动驾驶领域的应用大盘点

在Titanic数据集上应用AdaBoost元算法

AdaBoost入门

基于JavaScript的机器学习算法和工具库