有人能建议从60个GByte文件列表(每个大约650个MByte )中导入几个数值数据(以.mx格式)的替代方案吗?
这个问题太大了,以至于无法在这里发布--这个问题涉及到简单的统计操作,其数据量是可用内存(16)的两倍(大约34)。为了处理数据大小问题,我只是把事情分开,使用了一个Get / Clear策略来计算。
它确实有效,但是调用Get["bigfile.mx"]需要相当长的时间,所以我想知道是否会更快地使用BLOB或与PostgreSQL或MySQL一起使用的任何数据库,或者人们对GB的数字数据使用的任何数据库。
所以我的问题是:,在Mathematica中处理真正的大数据集导入的最有效的方法是什么?
我还没有试过,但是我认为来自DataBaseLink的DataBaseLink会比Get["bigfile.mx"]慢。
有什么经验可以分享吗?
(如果这不是一个非常具体的编程问题,很抱歉,但它确实会帮助我继续使用耗时的finding-out-what-is-the-best-of-the-137-possibilities-to-tackle-a-problem-in-Mathematica).。
https://stackoverflow.com/questions/8582795
复制相似问题