前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >偏差、方差和数据不匹配

偏差、方差和数据不匹配

作者头像
Steve Wang
发布2019-05-26 14:57:11
8580
发布2019-05-26 14:57:11
举报
文章被收录于专栏:从流域到海域从流域到海域

整理并翻译自吴恩达深度学习结构化机器学习第二周2.5。

数据的划分

在这里插入图片描述
在这里插入图片描述

目前使用的数据划分pattern如上图所示,分为以下四个部分:

  • train set(用来训练,前向传播、后向传播)
  • train-dev set (增加这一部分是为了检验你从训练集得到的参数能否泛化到该数据集)
  • dev set (dev set是为了衡量多个Classifier在该数据集上的表现)
  • test set (检验最终结果是否能够很好地解决实际问题,能否实际部署)

从各个数据集的error上获得的信息

在这里插入图片描述
在这里插入图片描述

Human-level指人类在目标问题上的error,比如人眼识别猫,人会识别错的error。

  • Human-level和Training error之间体现的是avoidable bias,可以通过训练更长的时间,选择更深的网络等单纯降低Bias的方法来降低。
  • Training error和Training-dev error之间体现的是Variance, 可以通过正则化、改变网络结构等单纯降低Variance的方法来降低。
  • Training-dev error和Dev/Test error之间体现的是data mismatch,即training set和test set的数据分布可能会有很大差别,导致你通过训练得到的参数无法很好的应用于解决实际问题。该问题可以用人工合成数据等方法使你的training set尽可能接近Dev/Test set,吴恩达这个视频的下一个视频对此有专门的解释说明。
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年12月13日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 数据的划分
  • 从各个数据集的error上获得的信息
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档