我有一个数据集,以荷兰大城市的邻里能源消耗为因变量和几个自变量。我想做一个随机森林回归模型来预测只有阿姆斯特丹的居民区的值。我主要想做的是在RF模型上做一个10折的交叉验证。=‘阿姆斯特丹’ 10折交叉验证,1/10的阿姆斯特丹作为测试数据,9/10的阿姆斯特丹+所有的without_amsterdam作为每折的训练数据。neg_mean_squared_error")
print(f'Scores for each fold a
我对随机森林是否需要显式交叉验证感到困惑?在随机森林中,我们有现成的样本,这可以用于计算测试精度。是否需要显式交叉验证。在随机森林中显式使用CV有什么好处吗?基于下面的代码,我发现很难理解随机森林中的CV是如何工作的:
model = BaggingClassifier(base_estimator=cart, n_estimators=num_