适应GridSearchCV_GridSearchCV评分_内核GridSearchCV参数 - 腾讯云开发者社区

、、

给出了一个叫m的机器学习模型，我对伽马值执行了一个gridSearchCV，以优化回忆。我想回答这个问题：“网格搜索应该找到最适合召回的模型。这个模型的召回比精确性要好多少？” 所以我做了gridSearchCV： grid_values = {'gamma': [0.001, 0.01, 0.05, 0.1, 1, 10, 100]} grid_m_re = GridSearchCV(m, param_grid = grid_values, scoring = 'recall') grid_m_re.fit(X_train, y_train) y_decisi

浏览 1提问于2018-02-28得票数 1

回答已采纳

1回答

我自己的模型对完整的数据进行了培训，比我从best_estimator获得的GridSearchCV和refit=True更好吗？

、、、

我使用XGBoost模型对一些数据进行分类。我有一个独立的测试集，我从来没有用过，直到结束。我使用GridSearchCV来确定最佳参数，并将cv拆分(5倍)输入其中，并设置refit=True，以便一旦它计算出它在完整数据上训练的最佳超参数(所有折叠，而不是仅4/5倍)并返回best_estimator。然后，我在最后的测试集上测试这个最好的模型。然后，我将这个模型的结果与我自己单独训练的模型和最好的超参数进行比较，用我自己的模型得到更好的结果。为什么会这样呢？当GridSearchCV使用最好的超参数对完整数据进行培训时，它是否仍然使用交叉验证？是因为GridSearchCV做了额外

浏览 0提问于2021-06-25得票数 2

2回答

如何仅对30%的数据使用RandomizedSearchCV或GridSearchCV

、、、

如何使用RandomizedSearchCV或GridSearchCV只对30%的数据进行处理，以加快处理速度。我的X.shape是94456,100，我正在尝试使用RandomizedSearchCV或GridSearchCV，但是它需要很长时间。我运行了几个小时的代码，但仍然没有结果。我的代码如下所示： # Random Forest param_grid = [ {'n_estimators': np.arange(2, 25), 'max_features': [2,5,10,25], 'max_depth': np.arange(

浏览 2提问于2020-03-24得票数 0

回答已采纳

1回答

我如何判断我的随机森林模型是否过分合适？

、、

我试着用UCI机器学习虹膜数据集来预测虹膜物种。我用RandomForestClassifier和GridSearchCV计算了平均绝对误差。然而，在使用测试集生成预测时，它给了我一个可疑的MAE为0.000000，得分为1.0分。这个模型是否太合适了？如果是的话，为什么会发生这种情况，我如何防止这种情况发生？ iris = pd.read_csv('/iris/Iris.csv') le = LabelEncoder() i2 = iris.copy() labelled_iris_df = pd.DataFrame(le.fit_transform(i2.Species)

浏览 0提问于2020-03-29得票数 1

回答已采纳

1回答

类型对象'GridSearchCV‘没有属性'cv_results_’吗？

、、

当我尝试绘制测试错误与训练错误时，以下代码出现了问题： from sklearn.model_selection import GridSearchCV trees_grid = {"n_estimators":[100,150,200,250,300,350,400,450]} grid_search = GridSearchCV(estimator=xgb,n_jobs=1,param_grid=trees_grid, scoring="neg_mean_absolute_error",cv=10,verb

浏览 8提问于2020-02-09得票数 0

回答已采纳

2回答

如何在不分割数据的情况下运行sklearn.model_selection.GridSearchCV？

、

我想评估一个模型管道的性能。我并不是在实地训练我的模型--我正在评估管道的真实标签，因此没有必要做一个交叉验证方案。但是，我仍然希望使用sklearn中提供的网格搜索功能。是否可以在不分割数据的情况下使用sklearn.model_selection.GridSearchCV？换句话说，我想运行Grid搜索，并在传递给管道的完整数据集上获得分数。下面是一个简单的例子：我可能希望为k选择最优的KMeans。实际上，我将在许多数据集中使用KMeans，这些数据集在某种意义上是相似的。碰巧，我有几个这样的数据集的一些真实的标签，我将称之为“培训”数据。因此，我决定不使用类似于的东西，而只是为我

浏览 3提问于2020-02-19得票数 1

1回答

使用K-折叠CV与保留方法是否多余？

、、

我正在复习一些代码，其浓缩版本如下所示。它采用原始设计矩阵X和响应向量Y，执行列车测试拆分(产生X_train，y_train和X_test，y_test)，然后只对训练部分执行分层K倍交叉验证。StratifiedKFold对象不应该拆分X, y而不是X_train、y_train，GridSearchCV对象不也应该适合整个数据集吗？按照目前的方法，在进行交叉验证之前，原始数据集似乎正在减少40%。 X_train, X_test, y_train, y_test = train_test_split( X, y, test_size=0.4, random_state=rando

浏览 0提问于2022-10-22得票数 2

1回答

RandomSearchCV和GridSearchCV是什么？

我在做logistic回归项目。在这样做的时候，我学到了以上的概念。那么randomsearchCV和gridsearchCV是什么呢？

浏览 1提问于2019-08-09得票数 2

回答已采纳

1回答

使用GridSearchCV与RandomForestClassifier使用大数据的问题，总是显示召回分数= 1，因此最佳参数变为冗余

、、、、

这是我的第一个StackOverflow问题，我需要帮助！我已经用尽我自己和通过实验寻找答案，但我希望来自社区的人能提供帮助。这是我在联合国大学的论文的工作，所以任何帮助都将是非常感谢的。我会尽量尽量总结： I正在与Scikit合作-学习分类器，并尝试用GridSearchCV对它们进行调优/CV，以便为以后与Keras/Tensorflow的工作形成基线。我的问题目前与RandomForestClassifier / GridSearchCV.有关我正在使用大量的数据。Kaggle 的信用卡欺诈数据数据是不平衡的，所以我使用SMOTE对0类和1类(欺诈)进行过采样，

浏览 4提问于2017-11-16得票数 1

2回答

GridSeachCV在ML模型上表现不佳

、、、、

from sklearn.model_selection import GridSearchCV svm2=SVC() grid={ 'C': [0.1, 1, 10, 100, 1000], 'kernel': ['linear', 'poly', 'rbf', 'sigmoid'], 'gamma': [1, 0.1, 0.01, 0.001, 0.0001] } svm_g

浏览 0提问于2021-10-09得票数 0

2回答

TypeError:估计器应该是实现“fit”方法的估计器

、、

我解决了Stepik的问题：一棵树是好的，但是保证它是最好的，或者至少接近它的保证在哪里呢？找到一个或多或少最优的树参数集的方法之一是对一组具有不同参数的树进行迭代，并选择合适的参数集。为此，有一个GridSearchCV类，它迭代为模型指定的参数之间的每个组合，对数据进行训练并执行交叉验证。然后，将具有最佳参数的模型存储在.best_estimator_属性中。现在的任务是根据以下参数对虹膜数据上的所有树进行迭代:最大深度--从1级到10级，用于分离的最小样本数从1到10张最小样本数--从1到10，并将最佳树存储在变量best_tree中。用GridSearchCV搜索命名变量。这是我的解

浏览 1提问于2022-01-11得票数 0

回答已采纳

2回答

提供缩放、降维、多元回归模型的平均预测和网格搜索交叉验证的学习管道。

、、、、

我想用一个滑雪板管道来做这件事： (-)缩放数据( StandardScaler ) (-)降维( PCA ) (-)使用GradientBoostingRegressor()和GridSearchCV()进行预测(从网格中获得具有最佳参数的模型) (-)使用RandomForestRegressor()和GridSearchCV()进行预测(从网格中获得具有最佳参数的模型) (-)取两种预测的平均值但我不知道该怎么做。我必须(量表和预测)2次，还是我可以分级，然后预测2次？泰克斯。

浏览 0提问于2019-04-29得票数 4

回答已采纳

2回答

如何在python中使用交叉验证执行GridSearchCV

、、、

我正在执行RandomForest的超参数调优，如下所示，使用GridSearchCV。 X = np.array(df[features]) #all features y = np.array(df['gold_standard']) #labels x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) param_grid = { 'n_estimators': [200, 500], 'max_fea

浏览 2提问于2019-04-10得票数 4

回答已采纳

1回答

为什么树比提升分类器要好得多呢？

、

我预测10个类别标签编码使用科学知识-学习与6个因素，120万例。DecisionTreeClassifier RandomForestClassifier ExtraTreesClassifier给出了0.9的准确性(以及精确性和召回率) AdaBoostClassifier GradientBoostingClassifier给出的精度为0.2 关于这个巨大的差异有什么建议吗？ (我正在做网格搜索)。代码： from sklearn.model_selection import train_test_split X_train, X_test, y_train, y_test = tra

浏览 0提问于2019-12-04得票数 1

回答已采纳

1回答

Scikit-learn使用线性内核支持向量机的GridSearchCV耗时太长

、、、

我从sklearn网站获取了示例代码，它是 tuned_parameters = [{'kernel': ['rbf'], 'gamma': [1e-3, 1e-4], 'C': [1, 10, 100, 1000]}, {'kernel': ['linear'], 'C': [1, 10, 100, 1000]}] scores = [('f1', f1_score)] for score_name, score_func in scores:

浏览 4提问于2012-09-27得票数 3

回答已采纳

1回答

SGDClassifier的正则化参数及迭代

、、

Python -学习SGDClassifier()支持l1、l2和弹性，寻找正则化参数的最优值似乎很重要。我得到了一个使用SGDClassifier()和GridSearchCV()来完成这个任务的建议，但是在SGDClassifier中只提供正则化参数alpha。如果使用诸如支持向量机或LogisticRegression等损失函数，我认为参数优化应该使用C而不是alpha。在使用Logisitic回归或支持向量机时，有没有办法在SGDClassifier()中设置最优参数？此外，我还有一个关于迭代参数n_iter的问题，但是我不明白这个参数是什么意思。如果与洗牌选项一起使用，它会像套袋

浏览 4提问于2016-01-01得票数 3

回答已采纳

1回答

ElasticNet极慢

、

我正在运行一个弹性网络模型使用滑雪板。我的数据集有70k的观测和20个特性。我想测试不同的参数并使用以下代码： alpha_plot, l1_ratio_plot = np.linspace(min_xlim, max_xlim, 50), np.linspace(0, 1, 10) alpha_grid, l1_ratio_grid = np.meshgrid(alpha_plot, l1_ratio_plot) l1_ratio_alpha_grid = np.array([l1_ratio_grid.ravel(), alpha_grid.ravel()]).T model_coeff

浏览 0提问于2022-09-20得票数 1

回答已采纳

1回答

梯度增强RandomSearchCV或GridSearchCV

、

在你的算法中，当你使用梯度增强时，你喜欢RandomSearchCV还是GridSearchCV来优化你的超参数？谢谢你分享你的经历。

浏览 0提问于2019-02-24得票数 2

回答已采纳

1回答

Scikit -规模与网格搜索相结合

、、、

我是新的科学工具包，有两个轻微的问题，结合一个数据规模和网格搜索。有效定标器考虑到交叉验证，我希望每次我们在K-1折叠上训练模型时，数据定标器(例如，使用preprocessing.StandardScaler() )只适合于K-1折叠，然后应用于其余的折叠。我的印象是，下面的代码将适合于整个数据集上的定标器，因此，我想修改它，使其像前面所描述的那样运行： classifier = svm.SVC(C=1) clf = make_pipeline(preprocessing.StandardScaler(), classifier) tuned_parameters

浏览 1提问于2015-12-03得票数 9

回答已采纳

1回答

Python:如何测试过拟合的RandomForest回归模型？

、、、、

我是这个领域的初学者，所以我可能做错了什么。我使用RandomForest作为回归模型，并想看看我的模型是否过分合适。以下是我所做的：编辑：我使用GridSearchCV进行超参数调优： rf = RandomForestRegressor(random_state=0) rf_params = {'n_estimators': [100, 500, 1000], 'max_depth': [3, 6, 9, None], 'min_samples_leaf': [2, 5, 10], 'max_featur

浏览 0提问于2020-12-15得票数 0

1回答

KMeans和Logistic回归如何在管道类中与MNIST数据集交互？

、、、、

我正在复习“手工机器学习与Scikit-学习，Keras & Tensorflow”的书。MNIST数据集的一种分类方法使用KMeans作为预处理数据集的手段，然后使用LogsticRegression模型执行分类。 from sklearn.pipeline import Pipeline from sklearn.model_selection import GridSearchCV from sklearn.datasets import load_digits from sklearn.model_selection import train_test_split from s

浏览 4提问于2022-02-03得票数 2

1回答

XGBoost早期停止cv与GridSearchCV

、、

我正在尝试XGBoost来解决一个回归问题。在超参数调优过程中，无论参数num_boost_round设置为什么，XGBoost的早期停止cv对于我的代码/数据都不会停止。此外，它还产生了比GridSearchCV更差的RMSE分数。，我在这里做错了什么？，如果我没有做错什么，，，那么早期停止cv比GridSearchCV?提供什么优势？ GridSearchCV: import math def RMSE(y_true, y_pred): rmse = math.sqrt(mean_squared_error(y_true, y_pred)) print 'RMSE:

浏览 4提问于2017-04-21得票数 2

1回答

用流水线和GridSearchCV求解LinearRegression问题的系数

、、、

我正在使用管道和GridSearchCV执行LinearRegression模型，我无法处理为X_train的每个功能计算的系数。 mlr_gridsearchcv = Pipeline(steps =[('preprocessor', preprocessor), ('gridsearchcv_lr', GridSearchCV(TransformedTargetRegressor(regressor= LinearRegression(), func = np.log,inverse_func = np.exp), param_grid=paramete

浏览 111提问于2021-10-22得票数 1

回答已采纳

2回答

Sci:当使用GridSearchCV时，获得估值器混淆矩阵的最简单方法是什么？

、

在这个简单的例子中，我用GridSearchCV训练了一个学习者。我想返回最好的学习者的混淆矩阵时，预测的全套X。 lr_pipeline = Pipeline([('clf', LogisticRegression())]) lr_parameters = {} lr_gs = GridSearchCV(lr_pipeline, lr_parameters, n_jobs=-1) lr_gs = lr_gs.fit(X,y) print lr_gs.confusion_matrix # Would like to be able to do this 谢谢

浏览 7提问于2016-03-22得票数 10

回答已采纳

2回答

你什么时候在sklearn中使用gridsearchcv和k-fold？

、、

什么时候你会使用gridsearchcv而不是k-fold？gridsearchcv是否通过CV参数自动执行k折叠？ gridsearch实现示例： GridSearchCV(svc_gc, param_grid=parameter_grid, cv=10)

浏览 22提问于2020-04-28得票数 0

1回答

spark_sklearn GridSearchCV init失败，参数错误

、、、

我正在尝试使用spark_sklearn.GridSearchCV，但得到了init参数错误。 TypeError: __init__() takes at least 4 arguments (4 given) 这是代码： from spark_sklearn import GridSearchCV gsearch2 = GridSearchCV(estimator=ensemble.GradientBoostingRegressor(**params), param_grid=param_test2, n_jobs=1) 如果我给GridSearchCV提供更多的参数，比如添加cv=5，

浏览 1提问于2017-12-08得票数 2

回答已采纳

1回答

为什么GridSearchCV (滑雪)改变了n_samples的价值？

、

我认为n_samples是训练例子的数量。但是当使用GridSearchCV时，n_samples变成32而不是50。使用GridSearchCV时的Error：预期n_neighbors <= n_samples，但n_samples = 32，n_neighbors = 50 Training示例： print(X_train.shape[0]) => 50 print(len(y_train)) => 50 This工作： neigh = KNeighborsClassifier(n_neighbors=50) neigh.fit(X_train, y_train)

浏览 0提问于2018-02-07得票数 2

回答已采纳

1回答

GridSearchCV没有保存最好的参数吗？

、、、、

因此，我使用GridSearchCV对超参数进行了调整，将模型与数据进行了拟合，然后使用了best_params_。我只是好奇为什么GridSearchCV运行best_params_所花费的时间太长，而不像RandomSearchCV那样会立即给出答案。GridSearchCV给出best_params_所需的时间类似于GridSearchCV优化超参数并将模型与数据相匹配所需的时间。当它已经这样做的时候，就好像它又在做一遍了。是这种情况吗？如果不是，当我第一次运行best_params_时，它应该保存GridSearchCV，为什么要花这么长时间呢？

浏览 0提问于2020-11-22得票数 0

回答已采纳

1回答

通过def函数运行模型

、

我有一组3个gredi估计器这样调用它们，但我不喜欢它们，我想通过循环调用它们。但是我的函数不起作用。 from sklearn.model_selection import GridSearchCV ##============================================================================== RFC1 = GridSearchCV(estimator=RFC, param_grid = params_RFC1, cv=cv_meth

浏览 6提问于2020-06-06得票数 0

1回答

如果有多个具有相同分数的估计量，GridsearchCV会选择什么？

、、

我在sklearn中使用RandomForestClassifier，并使用GridsearchCV获得最佳估计器。我想知道在GridsearchCV中，当有许多估值器(从简单的到复杂的)有相同的分数时，GridsearchCV的结果估计是什么？最简单的？还是随机的？

浏览 2提问于2019-03-27得票数 1

回答已采纳

1回答

使用GridSearchCV会使CalibratedClassifierCV在scikit-learn中出错。GridSearchCV对象没有属性'best_params_‘

、

我将CalibratedClassifierCV与RandomForest结合使用，并使用GridSearch确定最佳参数。然而，当我使用GridSearchCV读取最好的参数时，它说GridSearchCV对象没有属性'best_params_‘ from sklearn.calibration import CalibratedClassifierCV from classifiers import SVMClassification from sklearn.model_selection import GridSearchCV from imblearn.pipeline

浏览 0提问于2018-10-25得票数 1

回答已采纳

1回答

通过Gridsearchcv添加模型超参数的缺点是什么？

、

通过Gridsearchcv添加超参数有哪些缺点，假设我有这条管道 pipe_svm = Pipeline([ ('clf', svm.SVC()]) 我也在用Gridsearchcv， param_range =[1] gs_svm = GridSearchCV(estimator=pipe_svm, param_grid={'clf__C':param_range}) 为了简单起见，我只使用了一个超参数，即C(错误项惩罚参数)。在功能上，使用Gridsearchcv的方案是从给定的值集合中找到最佳的超参数，但在这种情况下，只提供

浏览 3提问于2021-08-18得票数 2

回答已采纳

2回答

Kfold交叉验证和GridSearchCV

、、、

好吧，我正在尝试理解如何以及在算法中的哪个点应用Kfold和GridSearchCV。此外，如果我理解正确，GridSearchCV用于超参数调整，即参数的值将提供最佳结果，Kfold用于更好的泛化，以便我们在不同的折叠上进行训练，从而减少偏差，如果数据以某种特定方式排序，则增加泛化。现在的问题是，GridSearchCV不是也在使用CV参数进行交叉验证吗？那么，我们为什么需要Kfold，如果我们需要的话，我们是否在GridSearchCV之前就做了呢？稍微概述一下这个过程会非常有帮助。

浏览 2提问于2018-03-19得票数 4

2回答

如果我们在管道中包括变压器的话，来自scikit-learn's `cross_val_score`和‘`GridsearchCV`’的k倍交叉验证分数是否有偏差？

、、、、

数据预处理(如StandardScaler )应该用于fit_transform火车组，并且只转换(不适合)测试集。我希望同样的fit/transform流程适用于模型优化的交叉验证。但是，我找到了cross_val_score和GridSearchCV fit_transform --使用预处理器的整个火车集(而不是fit_transform inner_train集，并转换inner_validation集)。我相信这是人为地从inner_validation集合中删除了方差，这使得cv评分(GridSearch用于选择最佳模型的度量)有偏差。这是个问题还是我真的错过了什么？为了演示上述

浏览 0提问于2019-08-26得票数 7

回答已采纳

2回答

XGboost:无法在管道中传递eval_set的验证数据

、、、

我想在流水线中为XGboost模型实现GridSearchCV。我有数据的预处理器，上面定义了代码，一些网格参数 XGBmodel = XGBRegressor(random_state=0) pipe = Pipeline(steps=[ ('preprocess', preprocessor), ('XGBmodel', XGBmodel) ]) 我想通过这些拟合参数 fit_params = {"XGBmodel__eval_set": [(X_valid, y_valid)], "XG

浏览 1提问于2019-05-29得票数 5

1回答

在Gridsearchcv sklearn中使用不同评分指标时出现的问题

、、、、

我正在做弹性网络回归，并试图使用GridSearchCV估计最佳的超参数。但是，当我将GridSearchCV中的评分从默认的r2更改为mean_squared_error时，GridSearchCV将每个特征系数设为0。我不知道为什么会这样。下面是代码。 param={ 'elastic__alpha':np.linspace(.1,1,15), 'elastic__l1_ratio':np.linspace(0,1,30) } pipe=Pipeline([('scalar',StandardScaler()),('elastic&

浏览 0提问于2020-09-23得票数 0

1回答

如何设置自己的评分与GridSearchCV从滑雪回归？

、、、、

我以前用GridSearchCV(...scoring=“准确性”.)分类模型。现在，我将使用GridSearchCV作为回归模型，并使用自己的错误函数设置评分。示例代码： def rmse(predict, actual): predict = np.array(predict) actual = np.array(actual) distance = predict - actual square_distance = distance ** 2 mean_square_distance = square_distance.mean()

浏览 5提问于2018-12-01得票数 4

回答已采纳

1回答

当与GridSearchCV一起使用时，fbeta_score和precision_recall_fscore_support之间的区别是什么？

、、

我正在尝试为一个多类分类问题在scikit learn中为GridSearchCV设置评分函数。我的问题是，fbeta_score和precision_recall_fscore_support之间的区别是什么？ precision_recall_fscore_support返回多个值。GridSearchCV使用哪个值/分数？它是否被设计为与GridSearchCV一起使用？

浏览 1提问于2015-12-17得票数 0

2回答

RandomForestRegressor和feature_importances_误差

、、、、

我正在努力从我的RandomForestRegressor中提取特性的重要性，我得到了一个： AttributeError：'GridSearchCV‘对象没有属性’GridSearchCV_importances_‘。有人知道为什么没有属性吗？根据文档，应该存在这个属性吗？完整的代码： from sklearn.ensemble import RandomForestRegressor from sklearn.model_selection import GridSearchCV #Running a RandomForestRegressor GridSearchC

浏览 4提问于2017-11-04得票数 10

回答已采纳

2回答

使用管道和GridsearchCV绘制最佳决策树

、、、

我有一个使用决策树作为估计器的GridsearchCV 现在，我想绘制与GridsearchCV的best_estimator相对应的决策树有一些关于堆栈溢出的回复，但没有一个考虑在GridsearchCV中使用管道 from sklearn.preprocessing import StandardScaler from sklearn.tree import DecisionTreeRegressor, plot_tree from sklearn.pipeline import Pipeline from sklearn.model_selection import GridSearc

浏览 25提问于2021-06-18得票数 0

2回答

GridSearchCV中的xgboost轮数

、、、

当我使用GridSearchCV和xgboost执行网格搜索时 kfold = StratifiedKFold(n_splits=3, shuffle=False, random_state=random_state) model = xgb.XGBClassifier() grid_search = GridSearchCV(model, param_grid, scoring="roc_auc", n_jobs=4, cv=kfold, verbose=1) GridSearchCV内部使用的轮数是多少？

浏览 0提问于2017-01-16得票数 2

1回答

滑雪板随机回归的正则化参数设置

、、、

我正在使用sklearn随机回归，例如。由于随机logistic回归采用L1-惩罚，因此需要设置正则化参数C(或Lasso中的α)。为了找到好的C值，我通常使用简单的GridSearchCV，如下所示。但是RandomizedLogisticRegression()不支持GridSearchCV，因为它包含引导。相反，我尝试将典型的LogisticRegression与GridSearchCV结合使用。 params = {'C':[0.1, 1, 10]} logi = LogisticRegression(penalty='l1') clf = Grid

浏览 5提问于2015-12-25得票数 4

回答已采纳

2回答

如何从R2 GridSearchCV中获取MSE和GridSearchCV？

、、、

我可以在管道上使用GridSearchCV，并将评分指定为'MSE'或'R2'。然后，我可以访问gridsearchcv.best_score_来恢复我指定的那个。如何获得GridSearchCV找到的解决方案的其他分数？如果我再次使用其他评分参数运行GridSearchCV，它可能找不到相同的解决方案，因此它所报告的分数可能不对应于我们有第一个值的模型。也许我可以提取参数并将它们提供给一个新的管道，然后使用新的管道运行cross_val_score？有更好的办法吗？谢谢。

浏览 2提问于2014-08-04得票数 6

回答已采纳

2回答

FitFailedWarning:估计值拟合失败。这些参数在这个火车测试分区上的得分将被设置为nan。

、、

我试图优化XGB回归模型的参数学习率和max_depth： from sklearn.model_selection import GridSearchCV from sklearn.model_selection import cross_val_score from xgboost import XGBRegressor param_grid = [ # trying learning rates from 0.01 to 0.2 {'eta ':[0.01, 0.05, 0.1, 0.2]}, # and max depth from 4 to

浏览 4提问于2021-08-20得票数 5

回答已采纳

1回答

GridSearchCV没有属性grid.grid_scores_

、、、

尝试过的grid.cv_results_没有纠正问题 from sklearn.model_selection import GridSearchCV params = { 'decisiontreeclassifier__max_depth': [1, 2], 'pipeline-1__clf__C': [0.001, 0.1, 100.0] } grid = GridSearchCV(estimator = mv_clf, param_grid = params, cv = 10, scoring = 'roc

浏览 0提问于2019-04-05得票数 9

1回答

在GridSearchCV和RandomizedSearchCV中获取个性化模型和定制评分

、、、、

GridSearchCV和RandomizedSearchCV的best_estimator_是：通过简单的评分方法之一:精确性、召回性、精确性等，只返回最佳的估计量。基于训练集的评估仅基于。我想丰富这些限制我自己对methodsEvaluate评分的定义是在测试集上进一步评分，而不是GridSearchCV所做的训练。最终，测试集的性能才是重要的。在我的网格搜索中，训练集倾向于提供几乎完美的精度。我正在考虑通过以下方式来实现这一目标： RandomizedSearchCVWith 获取GridSearchCV和GridSearchCV中的单个估计量/模型，在测试集上进行预测，并使用自

浏览 6提问于2020-07-12得票数 0

3回答

从GridSearchCV获取功能重要性

、、

有没有办法从sklearn的GridSearchCV中获取特征重要性？例如： from sklearn.model_selection import GridSearchCV print("starting grid search ......") optimized_GBM = GridSearchCV(LGBMRegressor(), params, cv=3, n_jobs=-1) # optim

浏览 8提问于2018-01-22得票数 12

回答已采纳

2回答

多项式回归的GridsearchCV

、、、、

我对机器学习很陌生，一直坚持这样做。当我试图在线性模型中实现多项式回归时，例如使用几个多项式范围(1，10)，得到不同的均方误差。实际上，我使用GridsearchCV方法来寻找多项式的最佳参数。 from sklearn.model_selection import GridSearchCV poly_grid = GridSearchCV(PolynomialRegression(), param_grid, cv=10, scoring='neg_mean_squared_error') 我不知道如何得到上述PolynomialRegression()估计量。我搜索的

浏览 3提问于2017-11-21得票数 3

回答已采纳

2回答

如何使用GridSearchCV测试嵌套流水线中的预处理组合？

、、、、

我一直在研究这个分类问题，使用sklearn的管道将预处理步骤(scaling)和交叉验证步骤(GridSearchCV)结合使用Logistic回归。以下是简化的代码： # import dependencies from sklearn.linear_model import LogisticRegression from sklearn.pipeline import Pipeline from sklearn.compose import ColumnTransformer from sklearn.preprocessing import OneHotEncoder, Standa

浏览 1提问于2020-09-02得票数 1

1回答

对于自己的模型类，GridSearchCV失败

、、

我试图使用一个回归模型，我已经实现了与GridSearchCV类的科学学习优化我的模型的超参数。我的模型类构建得很好，遵循了scikit-api的建议： class FOO(BaseEstimator, RegressorMixin): def __init__(self,...) *** initialisation of all the parameters and hyperparameters (including the kernelfunction)*** def fit(self,X,y) *** implementation of fit: just take

浏览 6提问于2020-07-07得票数 0