我已经有一些数据集不适合R中基矩阵类的有限维数,需要构建大的稀疏矩阵才能分类,例如100k tweet。我使用的是quanteda包,因为它现在比使用字典创建DocumentTermMatrix的包tm更有用和可靠,这使得进程非常需要小数据集的内存。我一直在阅读bigmemory包,该包允许这类容器,但我不确定它是否会在以后的分类中与插入符号一起工作。总的来说,我想了解这个问题,并构建一个解决方案,以便能够处理更大的数据集,因为RAM并不是一个(大的)问题(32 it ),但我正试图找到一种方法来解决这个问题,而且我对此感