前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Basic Concept

Basic Concept

作者头像
李小白是一只喵
发布2020-04-23 15:04:42
1.1K0
发布2020-04-23 15:04:42
举报

image.png

Basic Concept(基本概念)

使用偏移(bias)和 变化幅度(variance )作为估量model好坏的参数。

image.png

偏移(bias)

偏移表示训练数据的目标值

变化幅度(variance )

变化幅度表示训练数据坐落的区间

image.png

image.png

衡量一个模型中偏移(bias)和变化幅度(variance )过大的办法

  • 模型无法适合训练数据集的数据,表示偏移(bias)过大(欠拟合)
  • 模型适合训练数据集的数据,但是对于测试集数据误差较大,表示变化幅度(variance )过大(过拟合)

image.png

解决过大的偏移的办法(what to do with the large bias)

  • 增加特征(feature)的输入来增大模型的复杂度
  • 使用一个更加复杂的模型

解决过大的变化幅度的办法(what to do with the large variance)

  • 增加数据集(more data)
  • 添加规则化调整(regularization)

image.png

模型的选择

模型选择的理念:

  • 寻找偏移点和变化幅度之间的平衡
  • 模型的偏移点和变化幅度的误差都为最小
模型选择勿犯的错误:

模型选择过程中,不要使用训练数据集训练模型后,使用测试数据集验证错误的大小后就确定模型的误差大小,因为这样做只能是在本次使用的测试数据集中有效,如果放到公共的使用数据集中可能会误差值大于自己估测的误差值。

image.png

image.png

解决办法
  • 将训练数据集分为两部分,一部分用于训练,一部分用于验证测试
  • 训练完成后使用训练验证的数据选择出最好的model,再次使用全部的数据进行验证
  • 使用测试数据集获取这个model的误差值(一般就和公共使用时候的误差一致)

image.png

将训练集分成两部分的方法
  • 将训练集评分为三部分,分别代号1,2,3
  • 分三次使用分别使用作为测试数据,代入模型中
  • 获取三次数据的模型的平均值作为model的误差值
  • 使用全部的训练集数据验证model
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Basic Concept(基本概念)
    • 偏移(bias)
      • 变化幅度(variance )
      • 衡量一个模型中偏移(bias)和变化幅度(variance )过大的办法
      • 解决过大的偏移的办法(what to do with the large bias)
      • 解决过大的变化幅度的办法(what to do with the large variance)
      • 模型的选择
        • 模型选择勿犯的错误:
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档