首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >5倍交叉验证中随机林的性质

5倍交叉验证中随机林的性质
EN

Stack Overflow用户
提问于 2018-01-04 20:34:07
回答 1查看 717关注 0票数 1

考虑随机森林法在Caret中的5倍交叉验证,每一次建立的随机森林的性质是什么?例如,在虹膜数据集中:

代码语言:javascript
运行
复制
train_control <- trainControl(method="cv", number=5,savePredictions = TRUE) 
output <- train(Species~., data=iris, trControl=train_control, method="rf")
output$results$mtry
[1] 2 3 4

有3个mtry值,3个不同的森林是在交叉验证中建立的,这是真的吗?我怎样才能理解每一个折叠式森林的细节,像mtry?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2018-01-04 21:01:10

默认情况下,插入串函数将执行网格搜索,以寻找最佳的mtry。如果没有提供网格搜索的长度,它将执行长度为3的搜索。

从以下几个方面可以看出这些默认值:

代码语言:javascript
运行
复制
?trainControl
?train

tuneLength = ifelse(trControl$method == "none", 1, 3))
search = "grid"

当指定网格搜索(默认)和长度3(默认)时,使用插入符号函数var_seq查找mtry参数。从射频列车法可以看出这一点。根据功能的数量,此函数具有不同的行为。由于功能不足500个,它选择mtry如下:

代码语言:javascript
运行
复制
floor(seq(2, to = p, length = len))

其中p是特征的数量。Iris数据有4个特性,因此在3个可用的mtry值为2、3和4的情况下。

因此,这三个mtry值都是在5倍的CV测试。所以基本上有15种射频模型被制造出来。每辆5辆。最后,根据CV结果选择了最优的模型,并在整个列车数据基础上建立了最终模型--第16模型。

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/48103152

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档