The Long
我有一个data.frame,它有八个特性,但其中两个功能是包容性的,这意味着一个中的所有信息都是另一个的子集。因此,所有的狗和猫都是动物,所有的鲑鱼和鳟鱼都是鱼。这两个变量比其他六个变量中的任何一个都要重要得多。因此,如果我经营3个森林,一个使用A,一个使用B,另一个使用A&B,最后一个似乎是最好的。我有两个数据集tRFx和tRFx2,第一个数据集包含7个特性,包括B,但不包括A,第二个数据集包含8个带有A和B的特性,我想看看这两个独立模型的最优mtry是什么,以及它们之间的相