开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

社区首页 >专栏 >春节充电系列：李宏毅2017机器学习课程学习笔记30之集成学习 (Ensemble Learning)

春节充电系列：李宏毅2017机器学习课程学习笔记30之集成学习 (Ensemble Learning)

WZEARW

发布于 2018-04-08 14:52:22

1K0

发布于 2018-04-08 14:52:22

举报

文章被收录于专栏：专知

【导读】我们在上一节的内容中已经为大家介绍了台大李宏毅老师的机器学习课程的Recurrent Neural Network。这一节将主要针对讨论Ensemble进行讨论。本文内容主要针对机器学习中Ensemble的bagging、boosting以及stacking进行详细介绍，话不多说，让我们一起学习这些内容吧。

春节充电系列：李宏毅2017机器学习课程学习笔记21之结构化学习（Structured learning）介绍篇

春节充电系列：李宏毅2017机器学习课程学习笔记22之结构化学习（Structured learning）线性模型

春节充电系列：李宏毅2017机器学习课程学习笔记23之结构化学习-Structured SVM（part 1）

春节充电系列：李宏毅2017机器学习课程学习笔记24之结构化学习-Structured SVM（part 2）

春节充电系列：李宏毅2017机器学习课程学习笔记25之结构化学习-序列标注 Sequence Labeling（part 1）

春节充电系列：李宏毅2017机器学习课程学习笔记26之结构化学习-序列标注 Sequence Labeling（part 2）

春节充电系列：李宏毅2017机器学习课程学习笔记27之循环神经网络 Recurrent Neural Network

春节充电系列：李宏毅2017机器学习课程学习笔记28之循环神经网络 Recurrent Neural Network Part2

春节充电系列：李宏毅2017机器学习课程学习笔记29之循环神经网络 Recurrent Neural Network Part3

课件网址：

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17.html

视频网址：

https://www.bilibili.com/video/av15889450/index_1.html

李宏毅机器学习笔记30 集成学习(Ensemble Learning)

Ensemble的方法是团队合作，简单的来说就是好几个模型一起上的方法

Ensemble通常是最后实在不能提高实验结果然后采用，实验效果会提升一个档次。

相当于群殴的方法

1.bagging

下面讲述ensemble中bagging的内容

以前我们早已经介绍过小的模型得出的结果一般方差比较小，但偏差比较大。而大的模型得出的结果方差比较大，偏差比较小。

一个复杂的模型是均值很正确，方差很大，但将很多复杂模型平均，结果就是很接近真实的值

Bagging 制造出不同的dataset进行训练，得到多个不同的模型

当你的model很复杂的时候，你担心它overfitting，这时候就用bagging

Decision tree就容易overfitting,Random forest就是decision tree做bagging的版本

假如我们想要得到一个Miku（初音未来）的模型

树越深，模型越接近

Random forest是在每一次做decision tree的时候，随机决定哪一些feature或者question是不能用的

随着深度越来越深，效果越来越好

2.boosting

还有一个方法叫做boosting

Boosting是在不同的训练集上进行训练，事实上，我们通过改变损失函数来实现这个效果

adaboost的思想是f2在能够使得f1失败的训练集上进行训练

大致效果流程去下图所示

调整权重，使得错误的权重大

根据以上的算法思想进行计算

继续化简我们会得到d的值

最后整体算法如下图所示

最终我们得到一系列函数，我们需要整合他们

下面是一个具体例子

我们依据之前得到的算法进行更新

t=3时得到

然后将三个函数整合在一起得到最终结果

想了解更多可以查阅一下资料

3.stacking

还有一种方法叫做Stacking

简单来说就是把每个model的output当成一个feature，这些model有好有坏，所以整合在一起的时候需要设置权重。

请关注专知公众号

后台回复“LHY2017” 就可以获取 2017年李宏毅中文机器学习课程下载链接

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2018-03-20，如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自专知微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

评论

登录后参与评论

0 条评论

热度

最新

LV.