前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CS229 课程笔记之六:学习理论

CS229 课程笔记之六:学习理论

作者头像
口仆
修改2020-08-17 19:02:32
3080
修改2020-08-17 19:02:32
举报

1 方差与偏差的权衡

在讨论线性回归的时候,我们尝试用各种不同的模型来拟合训练集,如下图所示:

模型可以理解为假设(hypothesis)的集合。可以看到,过于简单或复杂的模型都不能对训练集之外的数据给出合理的预测,这表示训练集学习得到的东西并不能被很好地推广到其他数据上。

我们用「泛化误差」(generalization error)来量化这种差异,一个假设的泛化误差指不属于训练集的样本的预期误差。上图左边的线性拟合与右边的高次多项式拟合都有非常大的泛化误差,但其反映的问题大不相同。

左边的模型得到的假设具有非常大的「偏差」(bias),偏差较大指的是模型没有捕捉到训练数据的结构特征,即对训练数据「欠拟合」(underfitting)。

右边的模型得到的假设具有非常大的「方差」(variance),方差较大是指拟合出的模型可能只适合眼下这个小规模的有限训练集,即对训练数据「过拟合」(overfitting)。

我们需要在偏差与方差之间进行权衡:

  • 如果模型过于“简单”,参数非常少,那么可能会有很大的偏差,而方差则很小
  • 如果模型过于“复杂”,有非常多的参数,那么可能会有很大的方差,而偏差则较小

在上图的例子中,用二次函数模型进行拟合得到的效果,要好于其他两种模型。

2 预先准备

3 有限个假设的情况

5 思维导图

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-04-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 口仆 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1 方差与偏差的权衡
  • 2 预先准备
  • 3 有限个假设的情况
  • 5 思维导图
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档