如何在ktrain中使用交叉验证？_如何在交叉验证中使用.fit()_如何在训练和验证集上输入后使用交叉验证？ - 腾讯云开发者社区

、、、、

我正在使用ktrain包执行多类文本分类。ktrain官方网站(https://github.com/amaiya/ktrain)上的示例运行得很好 categories = ['alt.atheism', 'soc.religion.christian','comp.graphics', 'sci.med'] from sklearn.datasets import fetch_20newsgroups train_b = fetch_20newsgroups(subset='train', categorie

浏览 21提问于2021-07-23得票数 0

回答已采纳

1回答

distillbert ktrain‘太多的值无法解包’

、、、、

我正尝试在Colab中用ktrain运行DistilBert，但是我得到了“错误，太多的值无法解包”。我正在尝试执行有毒评论分类，我从CivilComments上传了'train.csv‘，我可以运行BERT，但不能运行DistilBert #prerequisites: !pip install ktrain import ktrain from ktrain import text as txt DATA_PATH = '/content/train.csv' NUM_WORDS = 50000 MAXLEN = 150 label_columns = [&#

浏览 36提问于2021-04-23得票数 1

1回答

如何在PySpark中使用交叉验证提取平均度量

、

我试图在Spark1.6.0中对随机森林执行交叉验证，我发现很难获得评估指标(精确性、召回性、f1.)。我要所有折叠度量的平均值。这可以用CrossValidator和MulticlassClassificationEvaluator获得吗？我只找到了一些示例，在这些示例中，评估稍后将在独立的测试数据集上执行，并使用交叉验证中的最佳模型。我并不打算使用一个训练和测试集，而是使用所有的dataframe (df)来进行交叉验证，让它分裂，然后取平均度量。 paramGrid = ParamGridBuilder().build() evaluator = MulticlassClassific

浏览 1提问于2017-08-04得票数 4

回答已采纳

1回答

如何在python中重用酸洗过的对象？

、

我已经对一些对象进行了酸洗，以便以后可以重用它们。例如，我酸洗了三个不同的梯度提升回归器，我想在以后重用它们。然而，当我尝试对回归器使用transform方法时，python抱怨需要首先对其进行拟合。代码如下： models #a list containing three regressors joblib.dump(models[0], 'gbm1.pkl') joblib.dump(models[1], 'gbm2.pkl') joblib.dump(models[2], 'gbm3.pkl') 然后我将它们重新加载到iPython中。

浏览 1提问于2015-06-10得票数 2

2回答

如何获得伯特的预科证书

、

我使用的是堆栈溢出选项卡分类csv数据集，该数据集已加载到dataframe中： X = df.post y = df.tags X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state = 42) 除了其他一些分类模型之外，我还想运行BERT，但是，它需要一个变量preproc。我不确定哪一种功能会得到这个结果： import ktrain from ktrain import text model = text.text_classifier('bert', (

浏览 3提问于2019-10-29得票数 2

回答已采纳

1回答

RidgeCV中的CV函数

、

我是与岭回归函数在sci学习。有一个交叉验证函数RidgeCV。基本(示例)设置如下： RidgeCV(alphas=[0.1, 1.0, 10.0], cv=None, fit_intercept=True, scoring=None, normalize=False,store_cv_values=True) 假设我想做一份10倍的简历。我是用"cv=“参数来设置它吗？我看到的每个RidgeCV都将cv设置为cv=None。 ( 1)甚至不确定这是否是设置10倍的正确位置。 2)在文档中找不到除"None“之外的其他CV=参数值。谢谢

浏览 0提问于2014-11-08得票数 1

回答已采纳

1回答

如何在R中正确使用plsr()？

、

我正在学习R中的plsr，遇到了几个让我困惑的不同的例子。在以下两种方法中，我看到了两种方法来拟合和找到最佳数量的部件。我只想知道哪一种是合适的，哪一种更好？ 1)假设我们有一个叫做数据的数据，它被划分为列车数据data.train和测试数据data.test。然后，将plsr安装为 plsr.fit = plsr(formula, data = data.train, validation = "CV", scale = TRUE) summary(plsr.fit) 然后根据最小的ncomp值求出CV值。 2)不分割任何数据，只需将模型拟合成完整的数据。 plsr(form

浏览 4提问于2017-07-19得票数 0

回答已采纳

1回答

使用scikit- learn，我如何在一个小数据集上学习SVM？

、、、、

使用scikit-learn，我构建了一个支持向量机，用于基本的手写数字检测问题。我的总数据集由235个观察值组成。我的观察结果由1025个特征组成。我知道使用支持向量机的优势之一就是在这样的情况下，有少量具有大量特征的观察值。在创建了我的SVM之后，我查看了我的混淆矩阵(如下所示)... Confusion Matrix: [[ 6 0] [ 0 30]] ...and意识到，保留我15%的数据用于测试(即36个观察值)是不够的。我的问题是:我如何使用交叉验证来解决这个小数据问题？

浏览 0提问于2014-01-29得票数 2

1回答

在sklearn中使用支持向量机时如何实际使用验证集

、

在使用SVM时，我发现对原始数据集执行三向拆分是一种很好的做法，类似于70/15/15的拆分。这种分割将对应于%70用于培训，%15用于测试，%15对应于所谓的“验证”。我很清楚为什么这是一个很好的实践，但我不确定实际执行这一操作所需的具体细节。很多在线资源讨论了这个过程的重要性，但是我似乎找不到对这个过程的明确描述(或者至少是算法描述)。例如，sklearn讨论了，但在提供任何可靠的工具之前就停止了。我的想法是：使用训练集训练算法使用测试集查找错误率 ?？调整参数再次获取错误率，使用验证集如果有人能给我指明一个好资源的方向，我会很感激的。

浏览 1提问于2014-01-26得票数 3

1回答

如何在训练和验证集上输入后使用交叉验证？

、、

所以我把自己搞糊涂了。目前，我已经获得了大约800个实例的数据集。我将其拆分为训练集和验证集，因为缺少值，所以我使用sklearn中的SimpleImputer，并对训练集进行fit_transform-ed，然后对测试集进行转换。我这样做是因为如果我想预测新的实例，如果有缺失值，那么我需要用我估算测试集的方法来估算它。现在我想使用交叉验证来训练和评分模型，但这将涉及到使用整个数据集并将其划分为不同的训练集和测试集，因此我担心由于拟合输入值而导致训练集中的泄漏？

浏览 30提问于2018-12-18得票数 3

2回答

有没有从模型文件ktrain中加载predictor的方法？

、、、、

我这样保存了我的模型： ktrain.get_predictor(learner.model,preproc=trans).save('model') 我想加载我的模型并使用它，并执行以下操作： predictor = ktrain.load(folder) x = "hello wold" prediction = predictor(x) 现在，我有一个文件夹“模型”，其中包含5个文件: vocab.txt，tokenizer_config.json，tf_model.preproc，special_tokens_map.json和config.json

浏览 40提问于2021-06-28得票数 0

1回答

在插入符号：：train函数中使用bagImpute预处理时丢失值错误

、、、、

我想用repeatedcv程序使用caret::train训练一个随机森林模型。我的数据有一些缺失的值，所以我想在train函数中使用preProcess="bagImpute"选项。我不想在train之外使用preProcess函数，因为我想为repeatedcv过程的每一次迭代提供bagImpute数据。但是，当我尝试这样做时，会引发一个错误： Error in { : task 1 failed - "'n' must be a positive integer >= 'x'" In addition: There w

浏览 3提问于2016-09-21得票数 1

1回答

如何在意外情况下拆分数据集和交叉验证？

、、、、

我写了下面的代码，它可以工作： from surprise.model_selection import cross_validate cross_validate(algo,dataset,measures=['RMSE', 'MAE'],cv=5, verbose=False, n_jobs=-1) 但是，当我这样做时：(请注意，此处以cross_validate而不是整个数据集的形式传递训练集) from surprise.model_selection import train_test_split trainset, testset = train_

浏览 33提问于2020-05-05得票数 0

1回答

如何加快在木星笔记本中创建的程序？

、

我有一个python程序，它是在木星笔记本中创建的。由于数据化和优化我所使用的，一个4倍的定制交叉验证在一定范围内大约需要30分钟完成。我的电脑环境: CPU i5 3.3 GHz，8GB DDR3内存，SSD。我在想如果有可能将其部署到某个服务器，并且可能会使速度稍微快一点呢？(数据文件只有大约30 to，我认为上传数据和程序都是可能的)。这也可能会帮助那些想要使用这个程序的人。我能做些什么来加速交叉验证吗？这是一种手工操作。我使用sklearn.cross_validation.KFold提取火车和测试集。然后，我循环遍历每一个折叠建立模型并测试其结果。我不确定是否有可能封

浏览 2提问于2016-07-28得票数 1

1回答

如何在python/sklearn中交叉验证来自随机森林的预测？

、、

请有人告诉我，如果这是正确的方法，计算交叉验证的精度我的分类器？我将我的数据集划分为训练数据的xtrain和ytrain，以及测试集的xtest & ytest。构建模型： RFC = RandomForestClassifier(n_estimators=100) 适合于训练集的： RFC.fit(xtrain, ytrain) ，这是我不确定的部分： scores = cross_val_score(RFC, xtest, ytest, cv = 10, scoring='precision') 使用上面的代码，“分数”会给我在我的模型上的精确性，而我的模型是关于

浏览 8提问于2015-07-04得票数 3

1回答

评价最佳模型

、

假设我有两个模型模式1：列车精度= 92.4% 验证精度= 37.6% 测试精度= 35.3% 模式2：列车精度= 37.0% 验证精度= 34.2% 测试精度= 34.1% 哪个是最好的模特？模型1非常过火，但最终性能更好。

浏览 0提问于2022-09-07得票数 1

1回答

如何在matlab中选择交叉验证的最佳模型？

、、

我有两个数据集，我想通过其中一个训练支持向量机分类模型(fitcsvm)，然后预测另一个的标签。我使用10倍交叉验证(crossval)来训练我的模型，所以我有10个不同的模型。我的问题是，这些模型中哪一个是最适合预测的，我如何才能找到它？这是我的代码： Mdl = fitcsvm(trainingData,labels); CVMdl = crossval(Mdl);

浏览 2提问于2020-10-23得票数 0

回答已采纳

2回答

交叉验证如何用于回归？

、、

对于回归型问题，我们知道结果是一个连续的值，那么如何交叉验证呢？在分类类型问题中，我们知道类标签很容易比较，但是在回归类型问题中如何比较呢？

浏览 0提问于2018-02-21得票数 1

回答已采纳

2回答

SVM分类中如何设置超参数

、、、

我正在研究利用支持向量机进行图像分类，一般定义为. 📷 N=培训实例数 W=是权重 f(x，W) =点积 λ被解释为通过交叉验证来设置，但是没有提到如何设置Δ。我知道支持向量机损失函数希望正确类的分数至少通过Δ大于不正确的类的分数，但它们不能解释Δ是如何导出的。在大多数示例中，定义为Δ= 1.0，而没有提到如何计算1.0。这个值是通过试错(交叉验证)确定的吗？一个人如何决定价值应该是什么？

浏览 0提问于2019-03-08得票数 3

回答已采纳

1回答

如何在交叉验证中使用.fit()

、

我是数据科学的新手，有点困惑。只想确保我的方法是有意义的。我创建的modells如下： lr7 = GaussianNB().fit(X_train,y_train) 然后立即使用cross_val_predict()。 y_pred8 = cross_val_predict(lr8, X_test, y_test, cv=5, n_jobs=-1, verbose=5) 首先交叉验证训练集不是更有意义吗？在scikitlearn中也有一个cross_validate()函数。对训练数据集使用此方法是否正确？在文档中，他们同时使用X和Y，而不是训练/测试拆分的数据。

浏览 34提问于2020-08-11得票数 0

2回答

如何离线使用列车？

、、、、

我训练我的英语模型跟随这个笔记本()。我能够保存我的预先训练的模型，并运行它没有问题。然而，我需要再次运行它，但是离线运行，而且它不起作用，我知道我需要下载这个文件，并做一些类似于这里所做的事情。然而，我无法理解我需要在哪里改变火车的设置。我负责这个： ktrain.load_predictor('Functions/my_english_nermodel') 这就是我遇到的错误： Traceback (most recent call last): File "Z:\Functions\NER.py", line 155, in load_bert

浏览 4提问于2020-06-02得票数 0

回答已采纳

1回答

如何使用蒸馏器模型对测试序列进行预测？

、、、、

我正在尝试使用带有蒸馏器模型的Ktrain对测试序列进行预测，我的代码如下所示： trn, val, preproc = text.texts_from_array(x_train=x_train, y_train=y_train, x_test=x_test, y_test=y_test, class_names=train_b.target_names,

浏览 15提问于2021-06-13得票数 0

1回答

如何在sklearn中对不平衡数据集进行交叉验证

、、、

我有一个高度不平衡的数据集，我想执行二进制分类。在阅读一些帖子时，我发现sklearn为不平衡数据集提供了class_weight="balanced"。所以，我的分类器代码如下。 clf=RandomForestClassifier(random_state = 42, class_weight="balanced") 然后，我使用上面的分类器进行了10折交叉验证，如下所示。 k_fold = KFold(n_splits=10, shuffle=True, random_state=42) new_scores = cross_val_score(clf

浏览 30提问于2019-03-31得票数 5

回答已采纳

1回答

交叉验证的实现

、、

我很困惑，因为很多人都有自己的方法来应用交叉验证。例如，有些应用于整个数据集，而有些则应用于培训集。我的问题是，下面的代码是否适合于在应用Cross-validation的同时实现交叉验证并从这样的模型进行预测？ from sklearn.ensemble import GradientBoostingClassifier from sklearn.model_selection import KFold model= GradientBoostingClassifier(n_estimators= 10,max_depth = 10, random_state = 0)#sepcifyi

浏览 2提问于2020-02-14得票数 0

1回答

如何获取当前位置(纬度、经度)。不使用get IP？

我想获取当前位置(在views.py中)，而不必使用IP来确定(因为它是不正确的)

浏览 0提问于2020-04-11得票数 1

1回答

对特征选择预处理进行交叉验证的动机是什么？

、、

我看过几篇关于特征选择(包装器和嵌入式方法)的文章和例子，他们把样本数据分成训练集和测试集。我理解为什么我们需要使用交叉验证(将数据分成训练集和测试集)来构建和测试模型的分数(所提出算法的实际预测)。但我不明白这样做的动机是什么？我们需要选择哪些特征没有真正的结果，那么它如何改进特征选择的过程呢？好处是什么？

浏览 37提问于2020-04-04得票数 0

1回答

帮助理解交叉验证。

、

我对交叉验证的理解是，我们将数据集划分为第1-k部分，然后使用第1部分作为验证集，第2-k部分作为培训集，然后使用第2部分作为验证集，其余部分作为培训集等等，直到我们使用每个部分作为验证集。我不完全明白的是：这里的实际目标是什么？我知道我们平均要做k轮交叉验证，但是我们的输出是什么？我读到过，在计算验证错误之后，我们放弃了每一轮的结果，那么我们如何从这个结果产生一个模型呢？验证和测试集(如果有的话)有什么区别？也就是说，我们通常将我们的数据分为培训数据和测试数据，但是我们是将我们的培训数据进一步划分为验证集，并在交叉验证过程中将我们的测试数据放在一边，还是对整个数据集进行交叉验证？

浏览 0提问于2019-05-07得票数 2

回答已采纳

1回答

叠加、叠加泛化算法

、、

我正在试图理解堆叠是如何工作的，但到目前为止，我还不确定我是否正确地理解了它。因此，我到目前为止所理解的是：我们用完整的数据集训练每个k基学习者(0级). 我们让每个k基学习者预测整个数据集。我们从k基学习者的所有预测中创建一个新的数据集。新的数据集看起来像我们的原始数据集+每个基础学习者的预测。该数据集用于培训元学习者(级别-1)。我的问题：到目前为止这是对的吗？我经常读到交叉验证在某种程度上是用来堆叠的，但我不知道，它是如何使用的？或者说这是我错过的一个重要部分？非常感谢

浏览 0提问于2016-10-11得票数 1

回答已采纳

2回答

KerasClassifier在序列分类中的应用

、、、、

我有一个binary classification问题，我需要根据2010-2015期间的客户交互来预测潜在的流行/流行产品。目前，我的数据集包括1000 products，每个产品都被标记为0或1 (即二进制分类)。标签是根据2016-2018期间的客户交互决定的。我正在计算how centrality measures changed over time for each product在2010-2015期间作为我的二进制分类问题的特性。例如，考虑下面的图，它显示了每个产品的degree centrality随时间的变化。更具体地，我分析了随centrality meas

浏览 0提问于2019-08-31得票数 0

回答已采纳

2回答

如何在sklearn.cross_validation.cross_val_score中获得内部分区的折叠本身？

、、

我在用： sklearn.cross_validation.cross_val_score 进行交叉验证，并获得每次运行的结果。这个函数的输出就是分数。是否有一种方法来获取在cross_val_score函数中内部分区的折叠(分区)本身？

浏览 8提问于2014-07-08得票数 1

回答已采纳

1回答

如何对机器学习模型进行物理测试？

我是机器学习的新手。我已经实现了一个机器学习模型，它检测声音(例如:喇叭、警报器、锤子等)并预测声音的类型。我必须在任何物体的实际声音上对模型进行物理测试。我该怎么做？

浏览 0提问于2018-07-12得票数 -2

1回答

LogisticRegression() vs LogisticRegressionCV()及其Cs超参数

、、

我使用LogisticRegression()建立了一个模型，经过网格搜索，数据显示了正则化强度的逆值，C = .0000001是进行预测的“最佳”值。这个参数对于LogisticRegression()很好，但是当我想要交叉验证时，我决定使用LogisticRegressionCV()，这里的等效c参数被表示为Cs，但是当我试图传递相同的变量Cs = .0000001时，我会得到一个错误： 797 warm_start_sag = {"coef": np.expand_dims(w0, axis=1)} 799 coefs = list() --&g

浏览 33提问于2022-06-27得票数 0

回答已采纳

1回答

检查的XSD - Input1数量低于Input2的10%.

、、

将要求并检查低于Input2的10%的Input1。在1.0版的XSD中可以进行这样的检查吗？

浏览 17提问于2021-05-11得票数 0

回答已采纳

1回答

如何在matlab中创建留一交叉验证？

、

我仍然对我的代码感到困惑。我试图在matlab中实现leave one out交叉验证来进行分类。所以在这里。我从训练中取出一个数据作为测试数据。我已经用matlab编写了一段代码。但我不能肯定它是正确的，因为结果是错误的。有人能帮我纠正一下吗？？非常感谢。这是我的代码： clc [C,F] = train('D:\fp\',... 'D:\tp\'); for i=size(F,1) testVal = i; trainingSet = setdiff(1:numel(C), testVal); % use the rest

浏览 0提问于2013-03-16得票数 1

1回答

如何在PySpark MLlib中确定随机森林算法的树数参数？

、、、、

我正在研究Random Forest algorithm in PySpark MLlib，并且对传递给模型的树参数的数量有疑问。Random Forest modeling在PySpark MLlib中的标准格式是： model = RandomForest.trainRegressor(trainingData, categoricalFeaturesInfo={}, numTrees=3, featureSubsetStrategy="auto",

浏览 0提问于2016-01-21得票数 2

1回答

由于ImportError:导入defs时DLL加载失败:找不到指定的过程，因此无法导入ktrain

下面是我在尝试import ktrain时得到的错误。 --------------------------------------------------------------------------- ImportError Traceback (most recent call last) ~\AppData\Local\Temp/ipykernel_16480/1394454297.py in <module> 1 import numpy as np ----> 2 import ktrain

浏览 83提问于2021-09-11得票数 1

1回答

如何在小数据集上进行测试？

、、

我使用Weka测试我的数据集上的机器学习算法。我有3800行和大约25个功能。我正在测试预测模型的不同特性的组合，并且似乎比使用交叉验证的oneR算法预测的要低。即使是C4.5也不能更好地预测，有时是这样，有时也不是基于仍然能够分类的特征。但是，在某个时刻，我将我的数据集分割成一个测试集和数据集(20/80)，并在测试集上测试它，C4.5算法比我的OneR算法具有更高的精度。我认为，由于数据集的大小很小，这可能只是一个巧合，它非常准确地预测了(目标仍然作为目标属性相对地分开)。因此，在这样的小数据集上使用交叉验证更为有用。然而，在另一个测试集上测试它，确实给了使用C4.5的测试集很高的准确

浏览 2提问于2015-08-04得票数 0

1回答

如何在10倍交叉验证中获得每个折叠的结果

、、

实际上，我知道在weka，中有一个GUI方法可以在10倍交叉验证中获取每个折叠的结果，但是我正在使用weka进行编程。不幸的是，我来自java程序的结果与weka的探索中的结果非常不同。我的代码是部分图像描述， Instances data1 = DataSource.read("D:/Users/.../XX.arff"); // upload the dataset data1.setClassIndex(data1.numAttributes()-1); // set class index data1.randomize(new Random(1)) data1.st

浏览 0提问于2017-07-06得票数 1

回答已采纳

1回答

如何在LibSVM中实现十重交叉验证

、

我已经能够运行LibSVM包中的示例了。现在我需要对一个数据集执行十重交叉验证(MATLAB)。我该怎么做呢？

浏览 1提问于2012-01-07得票数 1

回答已采纳

1回答

小于200个样本的小数据集上的二进制分类

、、、、

我有一个由181个样本、10个特征和一个目标变量组成的数据集。这10个特征本质上是数字和连续的。我必须执行二进制分类。我做了以下工作： I have performed 3 Fold cross validation and got following accuracy results using various models:- LinearSVC: 0.873 DecisionTreeClassifier: 0.840 Gaussian Naive Bayes: 0.845 Logistic Regression: 0.867 Gradient Boosting Classifier 0

浏览 0提问于2017-01-12得票数 0

1回答

验证数据NN的目的

除了使用验证数据来调优超参数之外，将验证数据包含到模型中还有其他好处吗？我所读到的就是它被用来调优超参数和检查是否过分合适。过拟合的检查是否与调优超参数分开？培训:调整参数(权重和偏差)验证:优化超参数测试:评估模型那么，如果我们不调优超参数，那么验证集就没有意义了？

浏览 0提问于2020-02-28得票数 2

回答已采纳

1回答

使用libsvm进行交叉验证以找到最佳参数

、、

为了找到与libsvm一起使用的最佳参数，我使用了下面的代码。我有一个文件，其中包含正负两个示例，每个示例都带有libsvm格式的hog向量。我有1000个积极的例子和4000个否定的例子。但按顺序排列，即前1000例为正例，其余为阴性。问题:现在，我开始怀疑这段代码返回的准确性是否实际准确。这是因为当我阅读5倍交叉验证时，它把前4/5的数据作为训练，剩下的1/5进行测试。这是否意味着测试集都是阴性的呢？还是随机选取这些例子呢？ %# read some training data [labels,data] = libsvmread('./heart_scale'); %

浏览 5提问于2015-03-20得票数 1

2回答

Python scikits SVM网格搜索和分类

、、、

我是一个初学者，我想检查几个问题。我有一个700个项目和35个功能的样本，我有3个类。我有一个数组X，其中包含使用"preprocessing.scale(X)“缩放的样本和特征。第一步是找到合适的支持向量机参数，我使用了嵌套交叉验证的网格搜索(参见)。我在“网格搜索”中使用了我所有的样本(X)。在网格搜索期间，数据被分成训练和测试(使用StratifiedKFold)。当我得到SVM参数时，我执行分类，将我的数据分为训练和测试。在网格搜索中使用我将在真正的分类过程中使用的相同数据可以吗？

浏览 3提问于2012-03-11得票数 0

回答已采纳

1回答

如何将数据集拆分为训练集和验证集

、、、、

我们有一些数据集：从1月到6月，每天销售100种产品，我们的目标是预测7月份的每一天的销售数量。那么如何将数据集分割为训练集、验证集

浏览 0提问于2016-05-18得票数 0

1回答

如何在R中用对数链进行岭回归

、

我想用glmnet或lm.ridge在R中做一个脊回归。我需要用log(Y)做这个回归 cost ~ size + weight ⇒ log(cost) ~ size + weight 但是，我发现没有像glm这样的glmnet或lm.ridge链接。对这个问题有什么想法吗？

浏览 4提问于2016-10-04得票数 0

回答已采纳

3回答

如何在交叉验证后选择分类器？

、

当我们做k-折叠交叉验证时，我们应该仅仅使用具有最高测试精度的分类器吗？从交叉验证中获取分类器的最佳方法通常是什么？

浏览 0提问于2016-09-13得票数 15

回答已采纳

2回答

使用单独的验证集在Python中优化超参数

、、

我正在尝试在Python语言中优化的超参数。我有3个独立的数据集:训练/验证/测试。因此，我希望使用特定的验证集来调优超参数，而不是使用交叉验证方法，即中描述的“第一种方法”。现在，sklearn有一些很好的内置方法来使用交叉验证(例如)来优化超参数，但是如果我想用特定的验证集来调优我的超参数呢？还可以使用像这样的方法吗？

浏览 12提问于2021-11-04得票数 1

2回答

如何在python中使用交叉验证执行GridSearchCV

、、、

我正在执行RandomForest的超参数调优，如下所示，使用GridSearchCV。 X = np.array(df[features]) #all features y = np.array(df['gold_standard']) #labels x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) param_grid = { 'n_estimators': [200, 500], 'max_fea

浏览 2提问于2019-04-10得票数 4

回答已采纳

1回答

基于WO分类的GL账户自动填充

、、、

我在Maximo 7.6.1.1中有工作顺序分类：我计划在分类中添加一个名为GL Account的字段：在创建工作订单时，我希望通过所选的WO分类自动填充WO的GL Account值。这是怎么做的？

浏览 3提问于2019-10-01得票数 0

回答已采纳

1回答

如何在验证数据集的每一折叠中打印准确性？并为数据帧中的每一行指定折叠号？

如何在验证数据集的每一折叠中打印准确性？以及如何将折叠号分配到dataframe中的每一行？ classifier = RandomForestRegressor(n_jobs = -1, criterion='mse') clf = GridSearchCV(classifier, param_grid = tunedParameters,cv=10) all_accuracies = cross_val_score(classifier, X=X_train, y=y_train, cv=10) print(all_accuracies)

浏览 0提问于2019-10-09得票数 1