在随机森林中,我们有现成的样本,这可以用于计算测试精度。是否需要显式交叉验证。在随机森林中显式使用CV有什么好处吗?基于下面的代码,我发现很难理解随机森林中的CV是如何工作的:
model = BaggingClassifier(base_estimator=cart, n_estimators=num_trees,
然后,我想了解模型是否遇到了方差问题,所以我首先想到的是比较训练和测试数据。这就是让我感到困惑的地方--据我所知,有许多不同的帖子是关于:
How CV误差与OOB误差相比,随机森林分类器的训练误差几乎总是0(即根据训练数据拟合我的模型并用它对同一组训练数据进行预测)--不管树深是怎样的关于第2点,我似乎永远无
在我的数据中,我想检查哪一个变量对结果影响最大,那就是股票收益率。我的数据如下。我的密码也附上去了。data_update <- data.frame(data,PEratio)
test <- data_update[48:57,]
对于上面的子集数据集训练和测试,我不确定是否需要对这些数据进行交叉验证。model.pred <- pred