前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >笔记|李宏毅老师机器学习课程,视频5错误来自哪里?

笔记|李宏毅老师机器学习课程,视频5错误来自哪里?

作者头像
陆勤_数据人网
发布2021-04-02 02:11:51
5260
发布2021-04-02 02:11:51
举报
文章被收录于专栏:数据科学与人工智能

视频5:错误来自哪里

一、Error来自哪里?

引子:视频3有一张图片

我们发现,测试集上测试时,越复杂的model并不总是带来好的模型性能。那么,这些错误来自哪里呢?

Error来自“bias”和“variance”。

为什么要研究错误的来源?研究和分析它,是为了帮助我们更好做模型设计。

bias和variance组合,可以形成如下四种情况,如图所示:

我们所希望的模型,能够满足低Bias和低Variance,以打靶为例,靶心是目标,也就是我们理想的函数,我们所希望的模型,就是不仅瞄的准,还很稳。

通过对Bias和Variance的理解后,不同模型下测试集误差的可视化,可以表示如下图:

通过这个图,我们可以获得这些认知:

1)如果模型欠拟合,意味着有大的偏差

2)如果模型过拟合,可能是有大的方差

对于大偏差,重新设计模型:

1)考虑更多的特征

2)设计更加复杂的模型

对于大方差,重新设计模型:

1)增加更多的数据集

2)正则化技术

如图所示:

二、模型选择

错误源自Bias和Variance,因此,设计模型的时候要对这两者进行一个平衡,保证总误差最小化。

三、交叉验证

利用交叉验证的思想去选择最佳模型。

如下图所示:

思考题:

1 偏差和方差,从数学角度,怎么理解?

2 如何做模型选择和评价?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-03-27,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档