我正在使用R包randomForest对一些生物学数据进行回归。我的训练数据大小是38772 X 201。
我只是想知道-对于树的数量ntree和每个级别mtry的变量数量来说,什么是一个好的值?我的输入数据中的每一行都是一个代表氨基酸序列的200个字符,我想构建一个回归模型来使用这样的序列来预测蛋白质之间的距离。
我想使用pmml库导出一个Caret随机森林模型,这样我就可以在Java中使用它进行预测。这是我得到的错误的复制品。data(iris)require(pmml)fitControl2 <- trainControl) :
no applicable method for 'pmml' applied to an object of class "