腾讯云

文章/答案/技术大牛

发布

社区首页 >问答首页 >使用h5py Killed将大型4Dnumpy数组压缩为HDF5 :9

问使用h5py Killed将大型4Dnumpy数组压缩为HDF5 :9
EN

Stack Overflow用户

提问于 2016-03-28 19:56:58

回答 2查看 1.1K关注 0票数 2

我刚接触大型数据集，很难将我正在阅读的解释和教程推断为我的问题。

我想要将37019张图像(每个450x600x3)保存到一个numpy数组中，并将其压缩到一个文件中进行训练。是实例化一个37019x450x600x3的0数组并在以后修改它们，还是逐个追加450x600x3数组更好？

现在我正在使用h5py，但它的结果是Killed: 9

import numpy as np
import h5py

imgarray = np.zeros((37019,450, 600, 3))

with h5py.File('deleteme.h5', 'a') as FOB:
    FOB.create_dataset("imgarray",data=imgarray,compression="gzip",compression_opts=9)

大约需要5分钟，然后：

Killed: 9

当图像的数量较少时，例如3700而不是37019，这是可行的。3700会产生一个30MB的.h5文件。

这是否意味着我的数组对于h5dy中的一个数据集来说太大了？我是否需要将其保存在更小的块中，单独的数据集或其他东西？你有什么推荐的方法可以方便的访问和修改？

谢谢你的帮助！

python

arrays

numpy

hdf5

h5py

回答 2

Stack Overflow用户

发布于 2016-03-29 02:27:04

在您的其他问题中，您发现zip归档可能有大小限制；它也可能适用于gzip压缩。或者可能只是花了太长时间。

h5py文档指出，将dataset保存为h5py文件时会动态压缩(并动态解压缩)。我还看到一些关于它与chunking交互的内容。您可能需要浏览h5py github存储库或相关的邮件列表。

您是否尝试过其他压缩方法或参数？

如何将数据保存在多个数据集中，每个数据集中的大小都很容易压缩？

票数 0

Stack Overflow用户

发布于 2016-03-30 04:33:23

可能有一种更好的方法可以做到这一点，但我最终只是将我的数据集分成了几个numpy数组，每个数组的大小为1000x450x600x3，gzip可以很好地完成这项工作。它花了25分钟，但都保存到一个400MB大小的.h5文件中。谢谢!

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/36270068

复制

我应该使用 PyCharm 在 Python 中编程吗？

python 网站数据库

Python 是一种广泛使用的编程语言，以其简单、多功能和庞大的开发人员社区而闻名。这个社区不断创建新的库和工具，以提高Python编程的效率和便利性。选择正确的环境来编写和调试 Python 代码可能具有挑战性，但 PyCharm 是一个很好的选择，从其他选项中脱颖而出。

很酷的站长

2023/02/20

4.7K0

在推荐系统中，我还有隐私吗？联邦学习：你可以有

联邦学习机器学习迁移学习神经网络深度学习

随着互联网覆盖范围的扩大，越来越多的用户习惯于在网上消费各种形式的内容，推荐系统应运而生。推荐系统在我们的日常生活中无处不在，它们非常有用，既可以节省时间，又可以帮助我们发现与我们的兴趣相关的东西。目前，推荐系统是消费领域最常见的机器学习算法之一[1]。以网络新闻为例，由于每天都有大量的新闻文章发布在网上，在线新闻服务的用户面临着严重的信息过载。不同的用户通常喜欢不同的新闻信息。因此，个性化新闻推荐技术被广泛应用于用户的个性化新闻展示和服务中。关于新闻的推荐算法 / 模型研究已经引起了学术界和产业界的广泛关注。

机器之心

2020/12/03

4.7K0

“我是零基础小白，我可以转行大数据吗？”

大数据

我们在做出一个决定之前总是会有这样那样的担忧和犹豫，特别是当自身厌倦了目前的工作和生活，思考未来的时候。“我要不要继续过这样的生活？”“我要不要待在舒适圈？”“我要不要转行？转行的话我没有经验，会不会不太好？”这其实就是我们做决定前的常态，特别是在如今高压的生活下。想要赚钱，但又迟迟不能做出决定。其实当你有这样那样的犹豫师，你心里已经有一个答案了，只是你没有勇气去做。如果你想获得高薪，大数据行业的确可以成为你转行的首选。

成都加米谷大数据

2021/03/10

6790

【说站】filter在JavaScript中过滤数组元素

编程算法 javascript

1、filter为数组中的每个元素调用一次callback函数，并利用所有使callback返回true或等于true值的元素创建一个新的数组。callback只会调用已赋值的索引，而不会调用已删除或从未赋值的索引。未通过callback测试的元素将被跳过，不包含在新的数组中。过滤出符合条件的数组，组成新的数组。

很酷的站长

2022/11/24

3.5K0

你知道在 JavaScript 中也能使用媒体查询吗

css javascript jquery html5

CSS媒体查询是任何响应式设计的核心成分。它们是将不同样式应用到不同上下文的好方法，无论它是基于视口大小、运动偏好、首选的配色方案、特定的交互，甚至是特定的设备，如打印机、电视和投影仪等。

前端修罗场

2022/07/29

4K0

Vue 中 props 是 Object 可以直接修改吗

data object parent 表单对象

https://www.zhihu.com/question/609822540/answer/3099837968

windliang

2023/08/18

1K0

JSON 在JavaScript 中的使用。

json javascript java 编程算法

JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。

愷龍

2022/10/06

10K0

c#一个list去掉其中重复元素

c#int list system using

立羽

2023/08/24

1940

[答疑]业务用例的研究组织可以在同一个建设系统中可以变化吗

uml

2013-02-08 9:44:15 上孙安俊(359***041) 请问大家一个问题，业务用例的研究组织可以在同一个建设系统中可以变化吗？ 2013-02-08 9:44:51 潘加宇(3504847) 没有必要变化了 2013-02-08 9:46:55 潘加宇(3504847) 这个划定的范围，能把你要改进的场景被包在里头就可以。 2013-02-08 9:48:41 上孙安俊(359***041) 如果想做一个部门业务管理系统， 2013-02-08 9:48:54 上孙安俊(359***041) 有时间，从部门外面，接报问题，需求处理， 2013-02-08 9:49:32 上孙安俊(359***041) 但是一些部门的内部管理，比如员工请假，工作记录，也会涉及到，这个时间的范围好像已经变了，按科室去管理了 2013-02-08 9:50:59 潘加宇(3504847) 员工还要上厕所呢，是不是这时需要改变研究对象为厕所？ 2013-02-08 9:51:42 潘加宇(3504847) 部门就可以了，把这些场景组织到部门的用例下面 2013-02-08 9:54:44 潘加宇(3504847) 既然改进的范围波及整个部门，就要用"部门"的眼光去思考"请假"等问题 2013-02-08 9:55:28 上李帅(958**7) 比如那些非常苛刻的工厂，员工上厕所都要记时，那么厕所应该也纳入研究对象么？ 2013-02-08 9:56:31 潘加宇(3504847) 不能"因为请假所以请假"，要想一想"员工请假"对部门的价值意味着什么？ 2013-02-08 10:14:41 上李帅(958**7) 意味着缺少了资源 2013-02-08 10:25:47 上孙安俊(359***041) 请假与加班是相对的，可以进行调休 2013-02-08 11:04:09 潘加宇(3504847) 我上面讲的不知道是否理解了？ 2013-02-08 11:11:15 潘加宇(3504847) 请假本身不是部门的用例，但会影响部门的某些用例的实现，把请假作为一个场景放在这些用例下面。 2013-02-08 11:15:53 刘佳(761**3) 利润=需求-设计，看来程序员仅仅会需求分析，会一些程序设计语言，不断制造东西却不维护，代码复用度太低，会影响利润 2013-02-08 12:02:38 上孙安俊(359***041) 好

用户6288414

2021/10/13

2.7K0

如果使用 JavaScript 原型实现继承

面向对象编程 iphone ios javascript ecmascript

在这篇文章中，我们将讨论原型以及如何在 JS 中使用它们进行继承。我们还将会看到原型方法与基于类的继承有何不同。

前端小智@大迁世界

2020/05/12

6980

【DB笔试面试572】在Oracle中，模糊查询可以使用索引吗?

编程算法 oracle

（1）若SELECT子句只检索索引字段，那么模糊查询可以使用索引，例如，“SELECT ID FROM TB WHERE ID LIKE '%123%';”可以使用索引。

AiDBA宝典

2019/09/29

9.9K0

我可以在一个构造函数中调用另一个构造函数么

c++

但在 C++11 版本之前是不可以的，不过你可以通过两种方式来模拟实现（可以参见 the C++ FAQ entry），

ClearSeve

2022/02/10

3K0

在java中，怎样把一个double数转换为字符串时，不用科学计数法表示。

bigdecimal double string

解决方法1：对Double类型的数字进行格式化输出，相对来说不是很精确 import java.text.DecimalFormat; public class TestDouble_String { public static void main(String[] args) { Double double1 = 123456789.123456789; DecimalFormat decimalFormat = new DecimalFormat("#,##0.00");/

程思扬

2022/01/10

1.7K0

[译]你可以在JSX中使用console.log吗？

react 编程算法 html 渲染

可是上面的代码并不可以得到他们想要的结果，浏览器会把这段代码console.log(this.props.todos) 当做纯文本在界面展示出来。

进击的大葱

2022/08/22

2.3K0

使用 pyenv 可以在一个系统中安装多个python版本

python

2016.01.06 21:02* 字数 82 阅读 24416评论 11喜欢 12

拓荒者

2019/03/11

3.2K0

我可以弃用这个端点吗？

api http https 网络安全微服务

让我们假设你是一个开发人员，接管了 Catalog 微服务的所有权。你被要求弃用/v1/catalog 端点而使用新的/v2/catalog 端点。你该怎么做呢？

CNCF

2022/03/25

1.7K0

JavaScript 使用getElementsByTagName获取元素

document 对象数组

可以使用内置对象document上的getElementsByTagName方法来获取页面上的某一种标签，获取的是一个选择集，不是数组，但是可以用下标的方式操作选择集里面的标签元素。

Devops海洋的渔夫

2019/06/02

1.7K0

Python这么火，我可以学吗？

python 机器学习爬虫运维

越来越多行业都在应用的Python，主要的应用领域有哪些呢？Python每个人都可以学吗？今天我们就来详细看一下。

老九君

2020/03/11

1.2K0

如果我学前端，XXX一定要学吗？

网站

image.png 今天一个同学问我，他不是先行者成员，他问我说，我听人说前端也分设计和开发的方向，如果我走开发的方向，那么XX一定要学吗？我回答他说，要，都要学。这类问题不止他一个，许多人问，都是什么这个要学吗？那个要学吗？问题的核心就是，有没有什么东西是不用学，而又可以让我正常工作，上班挣钱的？我真心想学，想的美啊，真美。请原谅我的口气。程序员，高收入。另一面，996，加班，过劳死。北上广深杭，到处都有累死的程序员。只看贼吃肉，没看贼挨打呀。我也明白他们的内心，也不一定是纯心的想少学东西。他们只是想

web前端教室

2018/02/06

8550

Spring Batch 可以在一个 Step 中有多个 Tasklet 吗

spring 批量计算

根据 Spring Batch 的设计，在一个 Step 中只能执行一个 Tasklet。

HoneyMoose

2022/10/15

1.5K0

相似问题

如果我使用的是jQuery，JavaScript事件可以工作吗？

如果不对double进行操作，我可以在Java中保持精度吗？

我可以在JavaScript中按值获取元素吗？

我可以在PHP函数中添加一个javascript警报吗？如果是，怎么做？

在Javascript中，我如何映射一个数组，其中元素可以分裂成多个元素？

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问使用h5py Killed将大型4Dnumpy数组压缩为HDF5 :9
EN

回答 2

Stack Overflow用户

Stack Overflow用户

如果我使用的是jQuery，JavaScript事件可以工作吗？

如果不对double进行操作，我可以在Java中保持精度吗？

我可以在JavaScript中按值获取元素吗？

我可以在PHP函数中添加一个javascript警报吗？如果是，怎么做？

在Javascript中，我如何映射一个数组，其中元素可以分裂成多个元素？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用h5py Killed将大型4Dnumpy数组压缩为HDF5 :9EN

回答 2

Stack Overflow用户

Stack Overflow用户

如果我使用的是jQuery，JavaScript事件可以工作吗？

如果不对double进行操作，我可以在Java中保持精度吗？

我可以在JavaScript中按值获取元素吗？

我可以在PHP函数中添加一个javascript警报吗？如果是，怎么做？

在Javascript中，我如何映射一个数组，其中元素可以分裂成多个元素？

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问使用h5py Killed将大型4Dnumpy数组压缩为HDF5 :9
EN