首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >什么是“遗漏的数据”?`sklearn.model_selection.GridSearchCV`是如何遗漏这些数据的?

什么是“遗漏的数据”?`sklearn.model_selection.GridSearchCV`是如何遗漏这些数据的?
EN

Stack Overflow用户
提问于 2019-08-28 23:04:14
回答 1查看 234关注 0票数 0

sklearn.model_selection.GridSearchCV的医生说

由搜索选择的估计量,即给出的数据上的最高分数(或最小损失)的估计量。如果是refit=False,则不可用。 ..。 所选择的参数是那些最大限度地提高了剩馀数据的得分的参数,除非传递显式得分,否则将使用它。

地段的人也是使用 术语

什么是“遗漏的数据”?它是否是交叉验证的一部分,例如,数据集的1/10?

数据是如何被sklearn.model_selection.GridSearchCV遗漏的

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2019-08-28 23:15:08

文档中,这个网格搜索方法接受一个名为cv的参数

简历: int,交叉验证生成器或可迭代的,可选的

这决定了K在KFold交叉验证中的值。它还提供了您可以遵循的其他策略。

对于整数/无输入,如果估计器是分类器,并且y为二进制或多类,则使用StratifiedKFold。在所有其他情况下,都使用KFold。

因此,为了回答您的问题,网格搜索循环通过参数空间,并对每个参数进行,例如,3倍交叉验证。您可以猜到,这将涉及在每一步中保留一些数据(在本例中为1/3Rs),以计算预测的准确性。这就是被遗漏的数据。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/57701019

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档