首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >科学学习GridSearchCV best_score_是如何计算的?

科学学习GridSearchCV best_score_是如何计算的?
EN

Stack Overflow用户
提问于 2014-06-07 10:17:07
回答 1查看 6.7K关注 0票数 6

我一直在试图弄清楚GridSearchCV的GridSearchCV参数是如何计算的(换句话说,它意味着什么)。文档说:

左边数据上的best_estimator分数。

所以,我试着把它转换成我理解的东西,并计算出实际的“y”和每个k折叠的预测y的r2_score,得到不同的结果(使用这段代码):

代码语言:javascript
复制
test_pred = np.zeros(y.shape) * np.nan 
for train_ind, test_ind in kfold:
    clf.best_estimator_.fit(X[train_ind, :], y[train_ind])
    test_pred[test_ind] = clf.best_estimator_.predict(X[test_ind])
r2_test = r2_score(y, test_pred)

我到处寻找关于best_score_的更有意义的解释,却什么也找不到。有人愿意解释一下吗?

谢谢

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2014-06-07 10:36:40

这是最优估计者的平均交叉验证分数。让我们制作一些数据并修复交叉验证的数据划分。

代码语言:javascript
复制
>>> y = linspace(-5, 5, 200)
>>> X = (y + np.random.randn(200)).reshape(-1, 1)
>>> threefold = list(KFold(len(y)))

现在运行cross_val_scoreGridSearchCV,都有这些固定的折叠。

代码语言:javascript
复制
>>> cross_val_score(LinearRegression(), X, y, cv=threefold)
array([-0.86060164,  0.2035956 , -0.81309259])
>>> gs = GridSearchCV(LinearRegression(), {}, cv=threefold, verbose=3).fit(X, y) 
Fitting 3 folds for each of 1 candidates, totalling 3 fits
[CV]  ................................................................
[CV] ...................................... , score=-0.860602 -   0.0s
[Parallel(n_jobs=1)]: Done   1 jobs       | elapsed:    0.0s
[CV]  ................................................................
[CV] ....................................... , score=0.203596 -   0.0s
[CV]  ................................................................
[CV] ...................................... , score=-0.813093 -   0.0s
[Parallel(n_jobs=1)]: Done   3 out of   3 | elapsed:    0.0s finished

注意score=-0.860602score=0.203596score=-0.813093GridSearchCV输出中;确切地说是cross_val_score返回的值。

请注意,“平均数”实际上是折叠上的宏观平均值。可以使用iid参数到GridSearchCV来获得样本上的微平均值。

票数 9
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/24096146

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档