我对随机森林是否需要显式交叉验证感到困惑?在随机森林中,我们有现成的样本,这可以用于计算测试精度。是否需要显式交叉验证。在随机森林中显式使用CV有什么好处吗?基于下面的代码,我发现很难理解随机森林中的CV是如何工作的:
model = BaggingClassifier(base_estimator=cart, n_estimators=num_
在weka中,如何检查诱导树是否适合训练数据?现在,这些是我的随机森林分类器建立在一个大训练集和一个小得多的验证集上的结果(根据大训练集的类比动态生成)。您说过,如果存在过度拟合,测试集(我称之为验证集)的性能会严重下降?但在这种情况下,它似乎并没有下降太多。%Total Number of Instances 25010
<e