首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >比获取(“raggedmatrix.mx”)更快的海量数据导入?

比获取(“raggedmatrix.mx”)更快的海量数据导入?
EN

Stack Overflow用户
提问于 2011-12-20 22:28:16
回答 2查看 3.5K关注 0票数 10

有人能建议从60个GByte文件列表(每个大约650个MByte )中导入几个数值数据(以.mx格式)的替代方案吗?

这个问题太大了,以至于无法在这里发布--这个问题涉及到简单的统计操作,其数据量是可用内存(16)的两倍(大约34)。为了处理数据大小问题,我只是把事情分开,使用了一个Get / Clear策略来计算。

它确实有效,但是调用Get["bigfile.mx"]需要相当长的时间,所以我想知道是否会更快地使用BLOB或与PostgreSQL或MySQL一起使用的任何数据库,或者人们对GB的数字数据使用的任何数据库。

所以我的问题是:,在Mathematica中处理真正的大数据集导入的最有效的方法是什么?

我还没有试过,但是我认为来自DataBaseLink的DataBaseLink会比Get["bigfile.mx"]慢。

有什么经验可以分享吗?

(如果这不是一个非常具体的编程问题,很抱歉,但它确实会帮助我继续使用耗时的finding-out-what-is-the-best-of-the-137-possibilities-to-tackle-a-problem-in-Mathematica).。

EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/8582795

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档