使用Tensorflow时将大型矩阵计算放入内存

为了计算最终的输出图像，我希望从第一阶段中获取在每个像素位置生成的值，并将其用作对整个输入图像应用的缩减函数的附加输入。第二步没有可训练的变量，但它的计算/内存成本随着输入的大小呈指数增长(每个输出像素都是所有输入像素的函数)。我目前正在使用tf.map_fn来计算输出图像。我将输出像素计算函数映射到第一阶段的结果上。我的愿望是tensorflow将分配内存来存储每个像素计算所需的中间张

浏览 7提问于2017-01-06得票数 1

1回答

大滤波器tensorflow conv2d的内存使用

、、

我发现tf.nn.conv2d对于如此大的过滤器变得不可用了--它试图使用超过60 it的内存，这时我需要关闭它。为什么内存使用量会随着过滤器的大小而增大？(注意:我还试着改变我的维度来使用单个conv3d，而不是一批conv2d，但这也有同样的问题) 将滤波器压平成具有形状

浏览 5提问于2017-08-30得票数 6

回答已采纳

1回答

在coo_matrix中使用TensorFlow

、、

我正在TensorFlow中做矩阵分解，我想使用来自Spicy.sparse的coo_matrix，因为它占用了更少的内存，并且它可以很容易地将我的所有数据放入我的矩阵中来训练数据。是否可以使用coo_matrix来初始化tensorflow中的变量？还是必须创建一个会话并使用sess.run()和feed_dict将数据输入到tensorflow中。

浏览 2提问于2017-03-02得票数 1

回答已采纳

1回答

并行训练神经网络，理论框架

、、、、

在AWS中的GPU机器上使用带有Tensorflow的Keras，我能够真正加快这个过程。这种并行化理论上是如何工作的？

浏览 3提问于2017-02-22得票数 2

回答已采纳

1回答

Python内存错误:计算大型矩阵的逆

、

我有一个200000 x 200000大小的大矩阵。我需要计算它的逆。但是它在使用numpy.linalg.inv时出现内存错误。有什么方法可以计算大型矩阵的逆。

浏览 0提问于2019-03-23得票数 1

2回答

如何将网络(图)数据复制到GPU？

、、

如果我想使用图形处理器在网络上进行一些并行计算( C++ AMP更好)，如何使用图形处理器内存中的网络数据？如何将邻接表复制到GPU内存中使用？邻接矩阵对于大型稀疏网络来说太大了，所以我不想使用邻接矩阵。

浏览 2提问于2013-07-25得票数 3

2回答

离散矩阵运算的矢量化方法

、、、、

我有许多矩阵w1、w2、w3...wn和形状(k*n1、k*n2、k*n3...k*nn)和形状的x1、x2、x3...xn (n1*m、n2*m、n3*m...nn*m)。我想让w1@x1，w2@x2，w3@x3 .分别使用。把它们一个接一个地繁殖，就会变慢。如何将此操作矢量化？+nn)矩阵和(n1+n2+n3+...+nn)*m矩阵，我们可以使用批处理索引来表示这些子<e

浏览 1提问于2020-01-08得票数 3

回答已采纳

1回答

分块矩阵-向量乘法

、、、

给出了具有nnz(A)非零的非常稀疏的nxn矩阵A和稠密的nxn矩阵B。我想计算矩阵乘积AxB。由于n很大，如果简单地执行，就不能将稠密矩阵B放入内存中。我有两个选择，但不确定哪一个更好。将矩阵B分解为n列向量[b1,b2,...,bn]。然后，我可以将矩阵A和任意一个向量bi放入内存中，并分别计算A*b1, A*b2, ..., A*bn。 O

浏览 3提问于2013-10-18得票数 0

1回答

我可以将压缩数据传输到GPU，然后在GPU上解压缩吗？

我正在尝试将用于计算的大型稀疏矩阵发送到GPU，而大部分计算时间都花在将数据从CPU传输到GPU上。这在Tensorflow中可行吗？

浏览 2提问于2016-09-07得票数 2

1回答

用tensorflow代替numpy进行数值逼近是个好主意吗？

、、

该程序的主要目的是在大型稀疏矩阵上执行svd，并计算大型矩阵的跟踪。<

浏览 0提问于2019-05-24得票数 1

回答已采纳

1回答

(使用MATLAB)我有一个大的坐标矩阵和一个大的稀疏邻接矩阵，其中坐标是相互连接的。我在前面已经问过如何在中有效地计算这些距离，但是我现在遇到了内存问题，这是一个更严重的问题。我用这个函数来计算距离矩阵Dists = pdist2(fruchterman_graph(:,:),fruchterman_graph(:,:),'euclidean');，但是它在大型网络上的速度和内存都失败了(coordinate(r

浏览 1提问于2013-04-04得票数 6

回答已采纳

2回答

一种计算大型负值矩阵sqrt的内存高效方法

、、、

我需要计算一个包含正负数的大型矩阵的sqrt。问题是因为sqrt对签名很敏感。所以我使用了下面的代码。(temp<0)temp=numpy.sqrt(temp) temp[neg]=-temp[neg] 在这段代码中，我首先存储负值的位置，然后在转换为正值后计算平方根，然后将负号附加到它们上。问题是它在第一条语句中给出了内存错误。是否有任何替代内存和计算效率的方法来完成相同的任务。<

浏览 30提问于2019-05-04得票数 2

回答已采纳

2回答

TensorFlow CUDA_ERROR_OUT_OF_MEMORY

我正在尝试用TensorFlow构建一个大型的CNN，并打算在一个多图形处理器系统上运行它。我采用了“塔式”系统，为两个CPU拆分批处理，同时将变量和其他计算保留在CPU上。我的系统有32 get的内存，但是当我运行我的代码时，我得到了错误： E tensorflow/stream_executor/cuda/cuda_driver.cc:924] failed to alloc/tensorflow/

浏览 7提问于2017-04-20得票数 13

1回答

PyTorch中的Dict支持

、、

我的目标是计算一个大型矩阵中的几个元素(1%)的梯度。但是如果我使用PyTorch的标准张量来存储矩阵，我需要将整个矩阵保存在我的GPU中，这会导致由于在训练期间可用的GPU内存有限而造成的问题。所以我在想，是否可以将矩阵存储为dict，只索引矩阵的相关元素，计算渐变和反向传播w.r.t --这些选择元素。到目前为止，我只尝试使用张量，但由于上述原因，它会导致内存</em

浏览 6提问于2022-03-08得票数 2

1回答

用CUDA计算大型矩阵产品

、、

我刚刚开始学习一些cuda编程，我感兴趣的是如何处理超过块/线程大小的大型矩阵的计算。例如，我有一个，它展示了如何执行平铺矩阵乘法，但是由于块大小和网格大小太小，它失败了。在上述代码中，如果块大小和网格大小分别设置为1，则只计算最终矩阵的第一个元素。答案很简单:用更大的块和网格大小调用内核，但是当我想要执行一个包含800万行和600万列的矩阵乘法时会发生什么--对于任何现代GPU来说，这都是任意大的，没有合适的网格和块大小吗？我认为，简单的情况应该是一个<e

浏览 2提问于2015-02-11得票数 0

1回答

使用整数向量的邻接矩阵节省内存的备选方案

、、、

我正在尝试使用BFS和Edmonds Karp算法来解决图像分割问题，我正在使用vector<vector<int>> Adj_Matrix作为数据结构来保存邻接矩阵，该矩阵保持了图形的垂直和水平链接。这是一个无向图，因此我认为可能有更好的替代方案来节省内存，而不是拥有完整的整数向量矩阵。Adj_Matrix.reserve(totalV); Adj_Matrix[i].reser

浏览 0提问于2018-05-03得票数 0

2回答

多输入LinearOperator

、、、、

我需要反演一个大的，密集的矩阵，我希望用西皮的gmres来做。幸运的是，密集矩阵A遵循一种模式，我不需要将矩阵存储在内存中。LinearOperator类允许我们构造一个对象，它充当GMRES的矩阵，可以直接计算矩阵向量积A*v。也就是说，我们编写了一个函数mv(v)，它以向量v作为输入并返回mv(v) = A*v。我们可以将线性运算符放入gmres命令中，以求矩阵向量乘积，而不必将A完全加载到内存

浏览 2提问于2013-11-27得票数 9

回答已采纳

1回答

TensorFlow数据集如何处理无法装入服务器内存的大型数据？

问题Spark可以处理具有多个节点的大型数据。对于中的问题，答案是使用Tensorflow变换，它使用Apache，它需要分布式计算集群(如Spark )。如果我们有较大的数据集，比如一个50 do的CSV文件，那么如何计算平均值或其他类似的统计数据。创建一个tf.train.ClusterSpec来描述集群因此，显然有一种方法可以设置TensorFl

浏览 3提问于2020-08-09得票数 1

1回答

在Matlab中使用svmtrain的内存不足

、、、、

使用==> svmtrain 453错误计算内核函数:内存不足。为您的选项键入帮助内存。当我查找此错误时，有人建议我使用SMO方法：svmtrain(X, Y, 'method', 'SMO');。大约一分钟后，我明白了： ==> seqminopt中的

浏览 4提问于2013-04-13得票数 3

回答已采纳

2回答

将函数应用于R中的距离矩阵

、

给定一个距离矩阵(使用dist计算)，将一个函数应用于距离矩阵的行。(b=1:N,c=runif(N))sumd <- adply(as.matrix(d),1,sum)有什

浏览 2提问于2009-11-07得票数 7

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

大滤波器tensorflow conv2d的内存使用

在coo_matrix中使用TensorFlow

并行训练神经网络，理论框架

Python内存错误:计算大型矩阵的逆

如何将网络(图)数据复制到GPU？

离散矩阵运算的矢量化方法

分块矩阵-向量乘法

我可以将压缩数据传输到GPU，然后在GPU上解压缩吗？

用tensorflow代替numpy进行数值逼近是个好主意吗？

如何在不超过内存约束的情况下计算大坐标集之间的距离？

一种计算大型负值矩阵sqrt的内存高效方法

TensorFlow CUDA_ERROR_OUT_OF_MEMORY

PyTorch中的Dict支持

用CUDA计算大型矩阵产品

使用整数向量的邻接矩阵节省内存的备选方案

多输入LinearOperator

TensorFlow数据集如何处理无法装入服务器内存的大型数据？

在Matlab中使用svmtrain的内存不足

将函数应用于R中的距离矩阵

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐