我试图用200 K的预测器和20行的数据对基因组数据进行随机森林分类。预测器已经被修剪,以便进行自相关。我尝试使用'ranger‘R包,但是它抱怨它不能分配164 to向量(我确实有32 to的RAM)。
发布于 2022-03-07 17:47:53
如果是基因组数据,有很多零吗?如果是这样的话,您可能可以使用Matrix
包转换为稀疏矩阵。我相信ranger
已经能够处理稀疏矩阵一段时间了,这可以很好地解决内存问题。
据我所知,ranger
是可用于p >> n的数据集的最佳R随机森林包。
https://stackoverflow.com/questions/71384035
复制相似问题