首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >测试集评价的置信区间

测试集评价的置信区间
EN

Data Science用户
提问于 2021-10-19 17:00:31
回答 1查看 451关注 0票数 1

我想知道,在评估测试集上分类器的性能时,“最佳实践”方法是如何找到置信区间的。

据我所见,有两种不同的方法来评估一种度量的准确性,比如精确度:

  1. 用公式区间=z* sqrt( (误差* (1 -误差))/ n)计算精度,其中n是样本大小,误差是分类误差(即1-精度),z是一个代表高斯标准差倍数的数字。
  2. 训练将测试集分割成k个折叠,并训练k个分类器,为每个分类器留下一个不同的折叠。然后在测试集上对所有这些进行评估,并计算均值和方差。

直觉上,我觉得后者会给我一个关于性能对数据变化有多“敏感”的估计,而前者会让我直接比较两种不同的模型。

我得说我有点困惑..。

EN

回答 1

Data Science用户

回答已采纳

发布于 2021-10-21 13:21:14

您需要区分预测的不确定性和类的不确定性。

举个例子,让我们说我们是在抛硬币。我百分之百地相信“尾巴”的概率是50%。

另一方面,明天下雨的可能性是90%,但天气预报员对此并不十分确定。

为了得到这个定义,我建议阅读本文:https://arxiv.org/abs/1910.09457

近年来,人们倾向于使用集合方法和提取一些基本统计量来计算给定的间隔。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/103285

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档