前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >模型评估方法-2

模型评估方法-2

作者头像
皮大大
发布2021-03-02 15:56:08
5740
发布2021-03-02 15:56:08
举报
文章被收录于专栏:机器学习/数据可视化

评估方法

在实际中,通常需要通过实现对学习器的泛化误差进行评估并进而做出选择。需要使用一个测试集来测试学习器对新样本的判别能力,然后以测试误差近似作为“泛化误差”。常用的几种评估方法:

  • 留出法
  • 留一法
  • 交叉验证法
  • 自助法

留出法

留出法hold-out,直接将数据集合分成两个互斥的集合,其中一个当作训练集合S,另一个当作测试集合T。

在S上进行训练模型,在T上进行测试和评估误差,作为对泛化误差的估计。注意点:

  1. 训练/测试集合的划分应该尽量保持数据分布的一致性,避免因为数据划分过程而引入额外的偏差。

数据集D上是1000个样本,其中500个正例,500个反例;那么划分的训练和测试集合应该也是1:1的比例。比如S中350个正例,350个反例;T中150个正例,150个反例

  1. 即使确定了划分比例之后,不同的划分方法仍然对模型的评估造成缺别。解决方法:单次使用留出法得到的结果往往不是稳定的,多次使用取平均值。
  2. 通常在留出法中采用的比例是\frac23-\frac45用于训练,剩下的用于测试。

交叉验证法

现将数据集合D划分成k个大小相似的互斥子集D_1,D_2,…,D_k。每个子集尽量保持数据分布的一致性,即从D中分层采样得到。

常规做法:用k-1个子样本作为训练集,剩下的作为测试集,从而获得k组训练/测试集合。交叉验证法评估结果的稳定性和保真性在很大程度上是取决于k值,其最常用的是10,称之为10折交叉验证法

交叉验证也需要随机使用不同的划分重复p次,最终的评估结果是p次k折验证的平均值。

留一法

留一法是留出法的特例。如果数据集D中有m个样本,若令k=m,则留一法不再受随机采样的影响。m个样本只有唯一的方式划分为m个子集,每个子集中包含一个样本。每个子集只比原来的数据集D少了一个样本,因此通过留一法得到的评估结果和原数据D得到的很相似。

缺点:当数据集很大量的时候,计算开销大。

自助法

自助法是通过自助采样法bootstrapping为基础。通过数据集D,如何生成一个数据集D^`

  1. 每次从数据集D中取出一个样本,放入D^`中,并且将该样本返回原数据中
  2. 重复上述步骤m次,得到m个样本的数据集D^`,这就是自助采样的结果。
  3. 总有一部分数据不会出现在D`中,概率是(1-\frac{1}{m})m,取极限之后结果是\frac1e,大约是0.3684.
  4. 通过自助采用的方式,数据集D`中总有36.8%的样本不会出现;因此,可以将D`作为训练集合,剩下的作为测试集合,这个得到的测试结果称为包外估计out-of-bag estimate。
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019-11-7,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 评估方法
  • 留出法
  • 交叉验证法
  • 留一法
  • 自助法
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档