使用Python K-Fold和随机森林对子集进行交叉验证_如何在python中使用随机森林对图像进行分类_使用‘脱字符’包对随机森林进行K-折验证时的变量编码 - 腾讯云开发者社区

python、random-forest、cross-validation、k-fold

我正在使用随机森林分类器，并且我想执行k折交叉验证。我的数据集已经被分成10个不同的子集，所以我想用它们来做k折交叉验证，而不是使用随机拆分数据集的自动函数。这在Python中是可能的吗？随机森林没有partial_fit()方法，所以我不能进行增量拟合。

浏览 8提问于2021-03-08得票数 0

1回答

使用Python K-Fold和随机森林对子集进行交叉验证

python、regression、random-forest、cross-validation、k-fold

我有一个数据集，以荷兰大城市的邻里能源消耗为因变量和几个自变量。我想做一个随机森林回归模型来预测只有阿姆斯特丹的居民区的值。我主要想做的是在RF模型上做一个10折的交叉验证。=‘阿姆斯特丹’ 10折交叉验证，1/10的阿姆斯特丹作为测试数据，9/10的阿姆斯特丹+所有的without_amsterdam作为每折的训练数据。neg_mean_squared_error") print(f'Scores for each fold a

浏览 222提问于2021-05-09得票数 0

1回答

多个分类算法总是以相同的分数准确地预测。这正常吗？如果没有，我应该怀疑什么？

classification、multilabel-classification

我正在使用Python机器学习库来实现分类算法。对于交叉验证，我使用重复的K-交叉验证.对支持向量机、Logistic回归、随机森林、决策树、K-邻域和朴素贝叶斯等方法进行了实验，并采用了二值相关、分类链和标签幂集变换等方法。我注意到，对于分类链，支持向量机，Logistic回归，随机森林，和K-邻居总是达到相

浏览 0提问于2018-12-03得票数 0

1回答

随机森林:k折交叉验证的OOB？

r、random-forest、cross-validation、r-caret

我是机器学习的新手，目前我正在尝试使用R中的插入符号和randomForest包实现随机森林分类。我正在使用trainControl函数，并反复进行交叉验证。也许这是一个愚蠢的问题，但据我所知，随机森林通常使用装袋将训练数据分成不同的子集并进行替换，使用1/3作为验证集来计算OOB。但是，如果您指定要使用</e

浏览 1提问于2021-03-19得票数 0

1回答

交叉验证与随机森林

machine-learning、random-forest、cross-validation

我使用随机森林来预测数据集中的标签。我的问题是:使用随机森林进行10倍交叉验证是否有意义？从直觉上讲，我可以说，随机森林可以单独进行交叉验证--那么在每次分割中进行交叉验证和构建随机森林分类器会有什么好处吗？

浏览 2提问于2014-03-12得票数 0

回答已采纳

1回答

随机森林参数调优R(插入符)和Python(学会)？

python、r、random-forest

问:是否有可能，甚至有必要，在训练一个新模型时，执行交叉验证检查来调优Python随机森林实现的参数(例如scikit学习)，就像R的插入符号中所做的那样？背景R:当使用R的插入符号的随机森林库时，可以通过执行n倍交叉验证来调整参数。背景Python:使用scikit学习，可以实例化一个随机森林回归器，并对该回归器执行交

浏览 0提问于2020-07-31得票数 0

1回答

CNN模型交叉验证的实现

python-3.x、tensorflow、scikit-learn、conv-neural-network

我已经建立了我的CNN模型，对8类图像进行分类。训练和测试步骤通过随机分割80%的训练图像和20%的测试图像完成，并计算了针刺度和F-测量结果。在进行了大量搜索之后，我发现了两个原因：2-测试数据集易于分类。我能得到

浏览 3提问于2020-02-17得票数 0

回答已采纳

1回答

Caret交叉验证随机森林方法中的mtry

r、random-forest、cross-validation、r-caret

我有一个包含499个观测和1412个变量的数据框架。我将数据帧分割成训练和测试集，用随机森林方法对卡莱特5倍交叉验证的训练集进行了尝试。我的问题是，随机森林方法的交叉验证是如何选择mtry值的？

浏览 1提问于2018-01-02得票数 1

回答已采纳

1回答

如何将在同一类型数据中学习的两个购物车决策树结合起来？

machine-learning、classification、data-mining、decision-trees、distributed

我们有分布式数据中心，我们在每个数据中心建立决策树。我们的问题是将我们的购物车决策树组合成一个购物车决策树。每个数据中心中的数据与同一事件相关(例如来自光传感器的数据)。我知道如何推广方法，但它们并没有给出我们想要的结果。有什么已知的方法可以做到这一点吗？

浏览 0提问于2016-10-20得票数 1

回答已采纳

1回答

H2O Python:提取具有最高验证数据集的网格搜索模型

python、h2o

我正在使用H2O Python使用网格搜索构建一个随机森林模型。我在训练和验证中对数据进行分割，并使用k折叠交叉验证来选择网格搜索中的最佳模型。我能够用训练集上最好的MSE检索模型，但我想检索验证集上具有最高AUC的模型。我可以用Python编写所有代码，但我想知道是否有一种H2O方法来解决这个问题。对我怎么做有什么建议吗？

浏览 2提问于2016-10-23得票数 2

回答已采纳

2回答

如何表示最终模型(例如随机森林)？

machine-learning、python、feature-selection、random-forest、cross-validation

我在dataset上运行了随机森林(不平衡的二进制目标类)，并使用交叉验证来调优参数，并使用递归特征消除和交叉验证来获得特征子集。但是概率阈值呢？

浏览 0提问于2017-01-18得票数 1

6回答

随机森林sklearn

python、scikit-learn、random-forest、cross-validation

我对随机森林是否需要显式交叉验证感到困惑？在随机森林中，我们有现成的样本，这可以用于计算测试精度。是否需要显式交叉验证。在随机森林中显式使用CV有什么好处吗？基于下面的代码，我发现很难理解随机森林中的CV是如何工作的： model = BaggingClassifier(base_estimator=cart, n_estimators=num_

浏览 0提问于2018-10-11得票数 2

1回答

过度采样只会平衡培训集，那么测试集呢？

classification、cross-validation、class-imbalance

在数据分类不平衡的情况下，我知道我们只是过采样了培训集(以防止数据从培训到测试子集的泄漏)，但是如果我的测试集中没有正数据点怎么办？测试集仍然非常偏斜，只有我的阳性类的1%。我使用XGBoost、随机森林、Logistic回归和KNN进行分类任务。同时，我也尝试过使用SMOTE、SMOTE和Class_weight来对我的训练集进行过采样.为了增加获得更多数据的机会，我将10倍改为5倍交叉验

浏览 0提问于2019-08-20得票数 2

回答已采纳

1回答

split()缺少一个必需的位置参数：'y‘

python、machine-learning、scikit-learn

我试图预测塑料流体的粘度，我使用随机森林回归和K倍交叉验证来训练我的数据。scores.append(model.score(input_test,output_test))print('Average K-FoldScore :' , np.mean(scores)) 我想把我的模型训练成10倍交叉验证</em

浏览 0提问于2019-09-03得票数 0

回答已采纳

1回答

在MATLAB中选择变重要特征后创建随机森林

matlab、random-forest、feature-selection

有没有可能选择变量重要性的特征，然后在MATLAB中创建一个随机森林？我使用TreeBagger()和OOBPermutedVarDeltaError()来获得重要特性的结果。但是现在我想使用这些重要的特性来重新创建一个随机森林。有可能吗？

浏览 0提问于2016-11-26得票数 0

1回答

递归特征消除结合scikit中的嵌套(略去一组)交叉验证

python、machine-learning、scikit-learn

我想对30组受试者进行二进制分类，这些受试者有230个样本和150个特征。我发现它很难实现，特别是在进行特征选择时，通过嵌套的参数调整留下了一组交叉验证，并使用两个分类器SVM和随机森林报告准确性，并查看选择了哪些特征。我是新手，我确信下面的代码是不正确的：我不知道在上面的哪里设置“随机森林分类器”，因为我想比较S

浏览 13提问于2018-12-17得票数 0

1回答

在插入符号：：train函数中使用bagImpute预处理时丢失值错误

r、machine-learning、random-forest、r-caret、cross-validation

我想用repeatedcv程序使用caret::train训练一个随机森林模型。我的数据有一些缺失的值，所以我想在train函数中使用preProcess="bagImpute"选项。我不想在train之外使用preProcess函数，因为我想为repeatedcv过程的每一次迭代提供bagImpute数据。na.fail.default(structure(list(Sepal.Length = c(5.1, 4.9, 4.7, : missing values in obj

浏览 3提问于2016-09-21得票数 1

1回答

树的随机森林数和交叉验证

machine-learning、bigdata、data-science

我在随机森林中使用了重复的交叉验证，如下所示: k=10 repeat =3我已经将我的随机森林设置为生长一千棵树，并在每个节点上使用6个变量进行拆分: ntree =1000mtry=6我需要了解交叉验证的每次迭代是否构建或者所有交叉验证迭代的总和为1000棵树？

浏览 26提问于2019-04-26得票数 0

1回答

数据集中每个组的多变量时序分类

time-series、lstm、rnn、multiclass-classification、forecasting

对我来说，这似乎不是一个好的解决方案，因为我将基本训练n数据集的模型。(每个电台) 包括站作为一个热编码的虚拟变量来使用它们作为分类器的特征，我不确定这一个。我将增加列(特性)的数量，从而增加维度。

浏览 0提问于2022-07-23得票数 1

1回答

K折叠交叉验证/分区模型

matlab、machine-learning、cross-validation

我有41个样本和6个预测因子的数据集。在Matlab中，我使用了树作为分类树。尽管oob误差很高，但该模型对41个标签进行了准确的预测。但在此基础上，我尝试用k折叠交叉验证模型，验证准确率仅为41%。我对此感到困惑。我的另一个问题是，当我试图交叉验证一个已经建立的集成模型时，k折叠算法是如何工作的。任何帮助都会很感激的。

浏览 0提问于2018-04-02得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

随机森林的手动k-折叠交叉验证

使用Python K-Fold和随机森林对子集进行交叉验证

多个分类算法总是以相同的分数准确地预测。这正常吗？如果没有，我应该怀疑什么？

随机森林:k折交叉验证的OOB？

交叉验证与随机森林

随机森林参数调优R(插入符)和Python(学会)？

CNN模型交叉验证的实现

Caret交叉验证随机森林方法中的mtry

如何将在同一类型数据中学习的两个购物车决策树结合起来？

H2O Python:提取具有最高验证数据集的网格搜索模型

如何表示最终模型(例如随机森林)？

随机森林sklearn

过度采样只会平衡培训集，那么测试集呢？

split()缺少一个必需的位置参数：'y‘

在MATLAB中选择变重要特征后创建随机森林

递归特征消除结合scikit中的嵌套(略去一组)交叉验证

在插入符号：：train函数中使用bagImpute预处理时丢失值错误

树的随机森林数和交叉验证

数据集中每个组的多变量时序分类

K折叠交叉验证/分区模型

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐