文章/答案/技术大牛

发布

社区首页 >问答首页 >Pickle+gzip -如何利用多核？

问Pickle+gzip -如何利用多核？
EN

Stack Overflow用户

提问于 2012-06-18 20:36:11

回答 3查看 1.7K关注 0票数 2

在开始工作之前，我使用简单的函数来恢复状态：

import pickle, gzip
def load(filename):
    """Loads a compressed object from disk
    """
    file = gzip.GzipFile(filename, 'rb')
    return pickle.load(file)        
records_df = load("records_all_in_one.gzp")

问题是恢复状态是我的应用程序的瓶颈。有没有什么简单的方法来告诉gzip/pickle组合来利用多进程？

当然，我总是可以拆分数据结构并从多个核心上的多个文件中读取它，但我宁愿看看是否有更聪明的方法来做到这一点。

最后一点信息--正在恢复的数据是一个大型的pandas DataFrame。

python

gzip

pickle

回答 3

Stack Overflow用户

发布于 2012-06-18 23:49:37

您可以运行GZip子进程，这是pigz的并行实现。

票数 3

Stack Overflow用户

发布于 2012-06-18 21:00:04

另一种方法是运行并行gzip实现，并使用python处理未压缩的数据。

您可以使用子进程来运行gzip实例，或者使用管道并通过stdin读取数据。

票数 2

Stack Overflow用户

发布于 2012-06-18 21:34:44

您可以尝试使用cPickle，因为它是up to 1000 times faster than pickle

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/11083038

复制

相似问题

问Pickle+gzip -如何利用多核？
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Pickle+gzip -如何利用多核？EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Pickle+gzip -如何利用多核？
EN