问具有p>>n和内存不足的随机林
EN

Stack Overflow用户

提问于 2022-03-07 16:15:05

回答 1查看 53关注 0票数 0

我试图用200 K的预测器和20行的数据对基因组数据进行随机森林分类。预测器已经被修剪，以便进行自相关。我尝试使用'ranger‘R包，但是它抱怨它不能分配164 to向量(我确实有32 to的RAM)。

发布于 2022-03-07 17:47:53

如果是基因组数据，有很多零吗？如果是这样的话，您可能可以使用Matrix包转换为稀疏矩阵。我相信ranger已经能够处理稀疏矩阵一段时间了，这可以很好地解决内存问题。

据我所知，ranger是可用于p >> n的数据集的最佳R随机森林包。

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71384035

复制

相似问题

问具有p>>n和内存不足的随机林EN