首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >具有p>>n和内存不足的随机林

具有p>>n和内存不足的随机林
EN

Stack Overflow用户
提问于 2022-03-07 16:15:05
回答 1查看 53关注 0票数 0

我试图用200 K的预测器和20行的数据对基因组数据进行随机森林分类。预测器已经被修剪,以便进行自相关。我尝试使用'ranger‘R包,但是它抱怨它不能分配164 to向量(我确实有32 to的RAM)。

  1. 是否有任何RF实现可以管理在可用内存中的分析(我希望避免增加交换空间)?
  2. 是否应该使用不同的算法(对于我所读到的,RF应该处理好p>>n)?
EN

回答 1

Stack Overflow用户

发布于 2022-03-07 17:47:53

如果是基因组数据,有很多零吗?如果是这样的话,您可能可以使用Matrix包转换为稀疏矩阵。我相信ranger已经能够处理稀疏矩阵一段时间了,这可以很好地解决内存问题。

据我所知,ranger是可用于p >> n的数据集的最佳R随机森林包。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71384035

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档