首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在训练和验证集上输入后使用交叉验证?

如何在训练和验证集上输入后使用交叉验证?
EN

Stack Overflow用户
提问于 2018-12-18 10:24:31
回答 1查看 596关注 0票数 3

所以我把自己搞糊涂了。

目前,我已经获得了大约800个实例的数据集。我将其拆分为训练集和验证集,因为缺少值,所以我使用sklearn中的SimpleImputer,并对训练集进行fit_transform-ed,然后对测试集进行转换。我这样做是因为如果我想预测新的实例,如果有缺失值,那么我需要用我估算测试集的方法来估算它。

现在我想使用交叉验证来训练和评分模型,但这将涉及到使用整个数据集并将其划分为不同的训练集和测试集,因此我担心由于拟合输入值而导致训练集中的泄漏?

EN

回答 1

Stack Overflow用户

发布于 2018-12-18 10:37:04

通常,您会希望将数据分成三个集-训练集、测试集和验证集。测试集应该完全排除在训练之外(您的担忧是正确的)。使用交叉验证时,您不需要担心将训练集和验证集分开-这就是交叉验证为您做的事情!只需将训练集传递给交叉验证器,允许它在幕后分为训练和验证,并在您的测试集上测试最终的模型(这完全被排除在训练过程之外)。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/53825586

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档