Caret:如何通过网格搜索找到最好的mtry和ntree

、、

我试着通过网格搜索找到最好的mtry和ntree，但我首先遇到了一些问题，我试着像这样找到它们： train_control <- trainControl(method="cv", number=5) grid <- expand.grid(.mtry=1:7, ntree = seq(100,1000,100)) # my dataset has

浏览 112提问于2021-01-05得票数 0

3回答

R插入随机林

、、

据我所知，train在默认情况下使用引导抽样(25次)和三次随机选择mtry，那么为什么要花这么长时间呢？我的问题是我怎样才能让它更快？ rffit=train(xtr2,ytr2,method="rf",ntree=500) rf.mdl =randomForest(x=xtr2,y=as.factor(ytr2),nt

浏览 2提问于2016-11-28得票数 1

回答已采纳

1回答

使用插入符号构建RandomForest

、、

本质上，他们设置RandomForest，然后是最好的mtry，然后是最好的最大节点，然后是最优的树数量。这些步骤是有意义的，但搜索这三个因素的交互作用不是比一次搜索一个因素更好吗？其次，我了解对mtry和ntree执行网格搜索。但我不知道如何设置最小节点数或最大节点数。通常情况下，保留如下所示的</e

浏览 44提问于2019-09-15得票数 3

回答已采纳

1回答

错误:调整参数网格应具有列mtry、SVM回归

、、、

下面的代码： control <- trainControl(method="cv", number=5)summary(custom) plot(custom) 我得到了错误 Error : The tuning parameter grid should have columns mtry

浏览 162提问于2020-04-09得票数 1

回答已采纳

1回答

使用插入符号在随机森林中显式设置ntree和mtry

、、、

我尝试使用插入符号显式地将树的数量和mtry传递给随机森林算法： library(caret)repGrid<-expand.grid(.mtry=c(4),.ntree=c(350)) rfClassifierRep <- train(label~metric="Accuracy"

浏览 106提问于2021-04-09得票数 0

回答已采纳

1回答

randomForest()和插入符号的randomForest (方法= "rf")的不同结果

、、

我还要补充的是，考虑到randomForest使用引导来生成适合每个ntree的样本，并且根据出出的预测来估计错误，我对在trainControl函数调用中指定"oob“和”引导“之间的区别有点模糊。= 5, importance=TRUE,=data.frame(mtry=2), nodesi

浏览 1提问于2016-04-18得票数 11

回答已采纳

1回答

Caret交叉验证随机森林方法中的mtry

、、、

我有一个包含499个观测和1412个变量的数据框架。我将数据帧分割成训练和测试集，用随机森林方法对卡莱特5倍交叉验证的训练集进行了尝试。我的问题是，随机森林方法的交叉验证是如何选择mtry值的？例如，如果您查看绘图，为什么过程不选择30作为mtry的状态值？

浏览 1提问于2018-01-02得票数 1

回答已采纳

1回答

用新数据对随机森林进行再训练

、、

metric='Accuracy', ntree100,rf_default$finalModel现在包含具有最佳参数的模型现在，我想用新的数据(类似于*.fit() in scikit)的最佳参数对模型进行再培训。我怎么能这么做？编辑我遵循了描

浏览 1提问于2021-04-10得票数 0

回答已采纳

1回答

我尝试使用randomForest包中包含的tuneRF工具来调优一个随机森林模型，我还在使用插入符号包来调优我的模型。问题是，我正在调整以获得mtry，并且每种方法都会得到不同的结果。问题是，我如何知道哪种方法是最好的方法，以及基于什么？我不清楚我是否应该期待类似或不同的结果。tuneRF:使用这种方法，我得到的最好速度是3 t <- tuneRF(train[,-12], train[,12],

浏览 117提问于2020-04-11得票数 2

回答已采纳

1回答

利用并行计算加速交叉验证的随机森林方法

我试图通过并行计算来加速我的随机森林方法。我的数据集包含20.000行和10列。可以预测的因变量是一个数值变量，自变量之间有两个因素(一个有两个水平，第二个有504个水平)。请给我一些有用的建议，如何加快下面的代码，我会感谢任何的建议。下面的解决方案是永远不会结束的。提前谢谢。library(doParallel); library(caret) forTraining <- cr

浏览 4提问于2014-11-20得票数 0

回答已采纳

1回答

R插入符：“二进制运算符的非数值参数”与qrf一起使用。

、、

当我将ntree设置为更高的数字时(在我的可复制示例中，这将是ntree = 150)，我的代码运行时不会出错。y = response, ntree = 30, # with ntree = 150使用我的真实数据的模型有ntree = 10000，但是任务仍然失败。我怎么才能解

浏览 3提问于2020-07-13得票数 2

回答已采纳

1回答

在R中循环一个函数

、、

我已经用R写了一个交叉验证/网格搜索风格的代码，它试图为给定的mtry值找到一个最佳阈值(使用随机森林算法)。我已经使用库mlbench中的Sonar数据发布了下面的代码，但是，这段代码似乎有一些问题。library(caret)library(randomForest) colnames=mtry, <e

浏览 2提问于2020-10-03得票数 2

2回答

已注册的doParallel集群不适用于列车/插入符号parRF模型

、、、

我无法让parRF工作，即使像parApply这样的其他东西也能正常工作。 method='parRF', tuneGrid = data.frame(mtry

浏览 4提问于2015-11-07得票数 4

回答已采纳

1回答

自动调随机林

我想自动调优随机森林模型，因为我的变量不断变化的基础上，实时。我正在使用iris数据集。我的代码是library(caret) mtry = 3 OOB error = 4% mtry = 4 OOB error = 5.33% -0.33333

浏览 3提问于2017-01-25得票数 1

回答已采纳

1回答

R中的随机森林模型

、、

有没有办法，我们可以通过微调训练数据的超参数来创建多个随机森林模型，并检查所有模型的测试数据性能，并将其存储在csv文件中？例如：-我有一个模型，mtry是6，nodesize是3，另一个模型，mtry是10，nodesize是4，我需要做的是在测试数据上测试这两个模型的性能，并存储关键的模型度量，如混淆矩阵，灵敏度和特异性'=0,'FN'=0,'TP'=0,'accurac

浏览 3提问于2019-10-30得票数 0

1回答

使用randomForest包的大量数据集

、

我的模型中有大约30万行数据和10个特性，我想在R中的R包中加入一个随机森林。为了使森林中的树木数量最大化，我可以在一个固定的时间窗口内，而不破坏一般性，我应该设置参数的合理范围是什么？

浏览 6提问于2014-01-02得票数 0

回答已采纳

1回答

如何向R中的随机森林中添加更多的树？

、、

是否有一种标准的方法来迭代地向随机森林中添加树？假设我使用的是caret包，我使用的是对于一些N，然后我想继续给它增加树，我会怎么做呢？

浏览 2提问于2021-01-19得票数 0

回答已采纳

1回答

如何利用R中的网格搜索找到随机森林中的最优树数？

、、、、

从下面的代码中，我得到了最优的mtry数。这是什么东西？如何找到分配给随机林算法的最优树数，从而提高算法的精度。如有任何意见，敬请见谅！提前谢谢。

浏览 0提问于2019-05-29得票数 0

回答已采纳

1回答

用Foreach和多列代替R中的for循环

、、、

我需要通过多线程加速for循环。我想为此使用库: foreach和doParallel。我以前使用过这些包，但只用于需要一个结果表的进程。我不知道如何使用它们导出多个表(这里是结果表)。我的问题要复杂得多，需要导出许多结果集。这里，为了简单起见，我使用虹膜数据。library(randomForest)results_overall <- data.frame()= irisTrai

浏览 5提问于2020-04-01得票数 3

回答已采纳

5回答

为随机森林回归模型设置ntree和mtry的值

、、、、

我的训练数据大小是38772 X 201。我只是想知道-对于树的数量ntree和每个级别mtry的变量数量来说，什么是一个好的值？有没有近似公式来找出这样的参数值？我的输入数据中的每一行都是一个代表氨基酸序列的200个字符，我想构建一个回归模型来使用这样的序列来预测蛋白质之间的距离。

浏览 14提问于2012-12-20得票数 41

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R插入随机林

使用插入符号构建RandomForest

错误:调整参数网格应具有列mtry、SVM回归

使用插入符号在随机森林中显式设置ntree和mtry

randomForest()和插入符号的randomForest (方法= "rf")的不同结果

Caret交叉验证随机森林方法中的mtry

用新数据对随机森林进行再训练

tuneRF与随机森林的插入符号调整

利用并行计算加速交叉验证的随机森林方法

R插入符：“二进制运算符的非数值参数”与qrf一起使用。

在R中循环一个函数

已注册的doParallel集群不适用于列车/插入符号parRF模型

自动调随机林

R中的随机森林模型

使用randomForest包的大量数据集

如何向R中的随机森林中添加更多的树？

如何利用R中的网格搜索找到随机森林中的最优树数？

用Foreach和多列代替R中的for循环

为随机森林回归模型设置ntree和mtry的值

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐