首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何在Google Colab中提取非常大的文件

如何在Google Colab中提取非常大的文件
EN

Stack Overflow用户
提问于 2020-03-16 23:31:14
回答 1查看 912关注 0票数 3

我正在尝试提取一个14.6 GB的7z文件(https://archive.org/download/stackexchange/stackoverflow.com-Posts.7z)。

我下载了它并保存在我的Google Drive中。我将我的驱动器挂载到Google Colab,然后将当前目录更改为文件所在的位置:os.chdir('/content/drive/My Drive/.../')

当我尝试解压缩文件!p7zip -k -d stackoverflow.com-Posts.7z时,它使用了当前实例的硬盘空间,在此过程中,它耗尽了所有可用的已分配硬盘空间,因此解压缩突然终止。

有没有一种方法可以在不使用实例的HDD空间的情况下提取文件,或者分块提取,这样提取就会成功。

PS:我相信,解压后的文件大小约为100 GB

EN

回答 1

Stack Overflow用户

发布于 2020-03-17 12:34:20

您可以尝试使用libarchive按块读取数据,而无需先解压缩数据。

https://github.com/dsoprea/PyEasyArchive

这是一个example notebook

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/60708805

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档