可以在Keras中释放GPU分配的资源吗？_如何在spyder的ipython中释放keras中的GPU资源？_在keras中我可以训练的班级数有上限吗？ - 腾讯云开发者社区

django、apache、memory、keras

我的服务器配置如下： Apache2.4.23. Mod_wsgi 4.5.9 通过使用Django框架和apache服务器，我们调用Keras深度学习模型。和模型调用成功后，模型一直运行在GPU内存中，除非关闭服务器，否则无法释放GPU内存。那么，在通过Apache+Mod_wsgi+Django调用Keras模型时是否有任何方法来控制GPU内存的发布？谢谢!

浏览 17提问于2017-05-12得票数 15

回答已采纳

1回答

多次加载Keras模型时GPU内存泄漏

python、tensorflow、keras

我有一个train.py文件，通过tensorflow.keras训练神经网络模型，最好的模型将根据train_loss保存为best_train.h5。培训时间约为7天。我有另一个文件test.py来测试在运行train.py期间保存的模型。在test.py模型中，我每小时加载一次best_train.h5以查看测试性能。代码如下： for i in range(7*24): time.sleep(1*60*60) model = tf.keras.models.load_model('best_train.h5') model.predict(test_da

浏览 14提问于2020-07-22得票数 2

1回答

一个失效的进程是否仍在系统中分配资源？

linux、process、nvidia

我有一台生产机器(Ubuntu18.04)，它使用Nvidia在GPU中运行进程。某个进程已经分配了内存，现在已经失效，使得GPU基本上无法使用。 ps -o ppid= -p 返回一个，这意味着PID=1是我已停止的进程的父进程，所以我不能杀死它。 nvidia显示，这个进程在GPU中分配了大量内存。所以我想我可以用 nvidia-smi -gpu-重置解放资源。子进程会产生什么麻烦吗？它能“看到”它所分配的资源不再可用吗？本质上:这有什么危险吗？

浏览 0提问于2023-04-18得票数 1

回答已采纳

1回答

库达: cudaMallocManaged处理出口吗？

c++、cuda

如果(在C++ +CUDA中) cudaMallocManaged()用于在主机和GPU内存中分配共享数组，而程序遇到(例如在主机代码中)一个exit(1)，这是否会永久地在GPU中留下悬空内存？我猜答案是不基于的，但我不确定GPU是否有某种回收机制。

浏览 2提问于2018-10-04得票数 0

回答已采纳

2回答

GPU内存未释放tensorflow

tensorflow、memory-leaks

我的问题是，在关闭Python中的tensorflow会话后，我的GPU内存没有释放。这三条线足以引起问题： import tensorflow as tf sess=tf.Session() sess.close() 在第三行之后，内存不会释放。我在很多论坛上或下，尝试过各种各样的建议，但是没有什么对我有用。详情请参阅我在下面的评论：在这里，我已经记录了我杀死进程从而释放内存的方法，但是这对于长时间运行的自动化进程来说并不有用。如果有进一步的建议，我会非常感激。我在使用Windows。编辑:我现在找到了一个解决方案，至少允许我做我想做的事情。我仍然是，不能释放内存，但是我能够‘重用

浏览 2提问于2018-09-25得票数 0

2回答

Keras:完成训练过程后释放内存

python、keras

我使用Keras构建了一个基于CNN结构的自动编码器模型，在完成训练过程后，我的笔记本电脑有64 GPU的内存，但我注意到至少1/3的内存仍然被占用，GPU内存也是如此。我没有找到释放内存的好方法，我只能通过关闭Anaconda提示符命令窗口和jupyter笔记本来释放内存。我不确定是否有人有好的建议。谢谢!

浏览 3提问于2018-06-24得票数 20

1回答

CUDA内核如何在多个块上工作，每个块都有不同的时间消耗？

cuda

假设我们运行一个具有4个块(b1、b2、b3、b3} )的内核函数。每个块都需要{10、2、3、4}时间来完成作业。而我们的GPU只能并行处理两个块。如果是那样的话，哪一个是正确的方式，我们的GPU如何工作？

浏览 3提问于2022-05-29得票数 0

1回答

pycuda如何运行垃圾收集？

cuda、pycuda

我正在学习pycuda，但每次我运行完一个程序，都会有一些东西占用GPU的内存，如何清除GPU的内存，或者pycuda如何运行gc？

浏览 32提问于2019-05-14得票数 1

5回答

OpenGL图形处理器内存清理，需要吗？

opengl、memory-management、memory-leaks、gpu

我是否必须通过glDelete*函数手动清理所有DisplayLists、纹理、(几何体)着色器等，或者当我的程序退出/崩溃时，GPU内存会自动释放吗？注: GPU内存是指专用显卡上的专用内存，而不是CPU内存。

浏览 0提问于2010-02-07得票数 9

回答已采纳

2回答

NVIDIA GPU的任务调度

cuda、gpu、gpgpu

我对nvidia GPU的任务调度有一些疑问。 (1)如果一个块(CTA)中的一条经线已经完成，但仍有其他经线在运行，则此经线是否会等待其他经线完成？换句话说，当所有线程都完成时，一个块(CTA)中的所有线程都会释放它们的资源，这样可以吗？我认为这一点应该是正确的，因为块中的线程共享共享内存和其他资源，这些资源是在CTA大小管理器中分配的。 (2)如果一个块(CTA)中的所有线程都挂起了一些较长的延迟，比如全局内存访问？一个新的CTA线程会占用像CPU一样的资源吗？换句话说，如果一个块(CTA)已经被分派到SM(流处理器)，它是否会占用资源，直到它完成？如果有人向我推荐一些关于GPU.Tha

浏览 1提问于2017-05-25得票数 5

2回答

不做glDeleteBuffers和其他OpenGL (3.3)清理可以吗？

opengl、resource-cleanup

有时我忘了做清理，并担心它们的资源是否驻留在GPU内存中。我使用的东西:着色程序，顶点数组对象和缓冲对象，纹理

浏览 1提问于2020-09-08得票数 0

回答已采纳

1回答

封装CUDA内核的最佳方法是什么？

c++、cuda

我正在努力使一个CUDA项目尽可能接近OO设计。目前，我发现的解决方案是使用Struct封装数据，对于每个需要进行GPU处理的方法，需要实现3个函数：对象将调用的方法。__global__函数，它将调用该结构的__device__方法。，在struct.中的__device__方法我给你举个例子。假设我需要实现一个方法来初始化结构中的缓冲区。看起来应该是这样的： struct Foo { float *buffer; short2 buffer_resolution_; short2 block_size_; __device__ initBuffer() {

浏览 2提问于2012-04-15得票数 4

回答已采纳

1回答

CUDA统一内存页，可在CPU中访问，但未从GPU中删除

cuda、tesla、unified-memory

我试着理解CUDA统一记忆的功能。我读过关于CUDA的统一记忆，供初学者使用。我编写了以下代码： #include <cstdio> #include <iostream> #include <fstream> #include <climits> #include <vector> __global__ void transfer(int *X) { X[threadIdx.x] = X[threadIdx.x]+3; } using namespace std; int main() { int *x;

浏览 23提问于2021-12-05得票数 -1

回答已采纳

1回答

了解训练后的神经网络内存使用情况

python、memory、tensorflow、gpu、keras

背景我有一个单层，256个隐藏单元，RNN，我和Keras一起训练过，现在我想部署它。理想情况下，我希望将这个RNN的多个实例部署到GPU上。然而，此时，当我用keras.models.load_model()加载模型时，它似乎在使用我可用的12 GPU内存中的11 GPU。问题为什么我的网络，它很小，占用这么多的内存？我只想预测，而不是训练。我装货的方式不对吗？有什么方法可以让我大致理解RNN结构与GPU内存的映射吗？考虑到这一点，我如何减少RNN消耗的内存量？当前理解我目前对我的网络应该使用多少内存的估计是从超参数的数量中得出的： 256输入权 2

浏览 1提问于2017-05-23得票数 2

回答已采纳

1回答

如何解决Tensorflow和cuda兼容性问题？

tensorflow、conv-neural-network

错误: UnknownError:未能得到卷积算法。这可能是因为cuDNN未能初始化，所以尝试查看上面是否打印了警告日志消息。执行部分:Conv2D 用于包安装的命令: conda install -c anaconda keras-gpu 安装 : tensorflow 2.0.0 cudatoolkit 10.0.130 0 cudnn 7.6.5 cuda10.0_ 角化物-gpu 2.2.4 0 tf.test.is_gpu_available()返回True

浏览 0提问于2020-01-24得票数 1

1回答

Tensorflow:我的GPU使用它的所有内存，但没有满载，这是正常的吗？

tensorflow

我目前正在尝试使用tensorflow 2.6和CuDNN运行一个基于文本的序列序列模型。代码正在运行，但花费的时间长得令人怀疑。当我检查任务管理器时，我看到以下内容：这在我看来很奇怪，因为所有的内存都占用了，但它并不是在沉重的负荷下。这是预期的行为吗？系统： Windows 10 Python 3.9.9 Tensorflow & Keras 2.6 CUDA 11.6 CuDNN 8.3 NVidia RTX3080ti 在代码中，我找到了GPU的下列设置 def get_gpu_config(): gconfig = tf.co

浏览 4提问于2022-01-20得票数 1

回答已采纳

3回答

尽管安装了tensorflow-gpu，但不使用GPU进行计算

tensorflow、machine-learning、keras、anaconda、gpu

我的电脑安装了以下软件: Anaconda (3)、TensorFlow (GPU)和Keras。有两个Anaconda虚拟环境-一个是Python2.7的TensorFlow，另一个是3.5的，都是GPU版本，。(我之前在一个单独的环境中安装了TensorFlow的CPU版本，但我已经删除了它。) 当我运行以下命令时： source activate tensorflow-gpu-3.5 python code.py 检查nvidia-smi，它只显示3MiBGPU内存的使用，所以看起来GPU并没有用于计算。(code.py是一个用Keras实现的简单的深度Q学习算法) 你知道会出什么问题吗

浏览 76提问于2017-05-07得票数 3

回答已采纳

2回答

我需要什么K.clear_session()和del模型(带有Tensorflow-gpu的Keras)？

python、tensorflow、memory-management、keras

我在做什么我正在训练和使用卷积神经元网络(CNN)进行图像分类，使用Tensorflow-gpu作为后端的Keras。我正在使用的 PyCharm社区2018.1.2 Python2.7和3.5 (但不是一次都是) Ubuntu 16.04 Keras 2.2.0 Tensorflow-GPU 1.8.0作为后端我想知道的在许多代码中，我看到人们使用 from keras import backend as K # Do some code, e.g. train and save model K.clear_session() 或在使用后删除模型：

浏览 5提问于2018-06-17得票数 58

1回答

AWS GPU上使用Theano的内存错误

amazon-web-services、theano、deep-learning、keras

我正在为分类任务构建一个简单的FeedForward网络。我在AWSg2.2xLarge实例上使用theano之上的keras。我的网络配置如下： batch_size = 32 nb_epoch = 50 dimof_input = 8100 dimof_middle = 16384 dimof_end = 16384 dropout = 0.2 dimof_output = 3 print('Build model...') model = Sequential() model.add(Dense(dimof_middle, input_shape=(dimof_inp

浏览 4提问于2016-03-03得票数 1

1回答

在预测时对高吞吐量流使用CUDA GPU

cuda、gpu、keras、theano、nvidia

我们正在尝试开发一个具有面向用户组件的自然语言处理应用程序。用户可以通过API调用模型，并返回结果。模型是使用Keras和Theano进行预训练的。我们使用GPU来加速训练。但是，使用GPU仍然可以显著加快预测速度。目前，我们有一台带有两个GPU的机器。然而，在运行时(例如，当运行面向bits的用户时)存在一个问题:通过CUDA共享GPU的多个Python进程似乎不能提供并行加速。我们将nvidia-docker与libgpuarray (pygpu)、Theano和Keras一起使用。GPU仍然大部分是空闲的，但是添加更多的Python工作线程并不会加快这个过程。解决在API后面运行GPU

浏览 1提问于2017-05-10得票数 0

1回答

释放Google中的GPU内存

keras、memory-management、conv-neural-network、gpu、google-colaboratory

我想知道在Google中是否有办法释放GPU内存。我正在训练一些CNN在一个循环与eurosat/rgb/数据集从tf.datasets。模型没有那么大，数据集也不是那么大。错误如下： Epoch 1/8 --------------------------------------------------------------------------- ResourceExhaustedError Traceback (most recent call last) <ipython-input-15-c4badfe8da7d> in

浏览 0提问于2021-10-27得票数 1

1回答

GPU内存问题

memory、cuda、gpgpu

关于gpu内存，我有三个问题：为什么我的应用程序在不同的机器上占用不同数量的GPU内存(用不同的显卡)？当GPU上没有足够的内存供我的应用程序使用时，会发生什么？可以用RAM内存代替吗？谁负责这个内存管理？我看到了GPU内存的奇怪行为:我的应用程序以2.5/4GB的GPU内存启动。当运行某个函数时，GPU内存达到最大值(4GB)，然后立即下降到不符合逻辑的值(比此函数之前分配的要少)。怎么解释呢？

浏览 3提问于2016-09-25得票数 0

3回答

如何使TensorFlow使用100%的GPU？

tensorflow、keras、deep-learning、gpu、nvidia

我有一台有RTX 2060 GPU的笔记本电脑，我正在使用Keras和TF 2来训练LSTM。我也在监测nvidia-smi使用gpu的情况，我注意到jupyter笔记本和TF最多使用35%，通常gpu的使用率在10-25%之间。在目前的情况下，花了7个多小时来训练这个模型，我想知道我是做错了什么，还是它是Keras和TF的限制？我的nvidia-smi输出： Sun Nov 3 00:07:37 2019 +-----------------------------------------------------------------------------+ | NV

浏览 7提问于2019-11-02得票数 1

回答已采纳

1回答

keras自动使用gpu吗？

tensorflow、model、keras、gpu

它似乎自动使用gpu，但我不知道为什么。首先，我声明如下： tf_config = tf.ConfigProto( allow_soft_placement=True ) tf_config.gpu_options.allow_growth = True sess = tf.Session(config=tf_config) keras.backend.set_session(sess) 然后，我定义了一些模型如下 with K.tf.device('/gpu:0'): some keras model 这很明显，它将使用gpu，我检查它使用了第一个gpu(索引为0

浏览 0提问于2018-12-26得票数 4

回答已采纳

2回答

我是否可以在cudaMalloc中分配比必要的内存更多的内存以避免重新分配？

c、cuda、malloc、gpu、cublas

我正在编写一个代码，它使用cuSparse在GPU上执行数千个稀疏矩阵的计算。由于内存在GPU上是有限的，我需要一个一个地处理它们，因为其余的内存被其他GPU变量和密集矩阵占用。我的工作流程(以伪代码表示)如下： for (i=0;i<1000;i++){ //allocate sparse matrix using cudaMalloc //copy sparse matrix from host using cudaMemcpy //do calculation by calling cuSparse //deallocate sparse matrix with cudaFree

浏览 0提问于2018-07-16得票数 0

回答已采纳

1回答

为什么GPU上的总内存和空闲内存有这么大的差别？

tensorflow、keras

我有一个GeForce GTX 1070并使用由tensorflow支持的Keras。当我在没有运行任何操作的情况下加载Keras时，它已经使用了大量的GPU内存。为什么会这样呢？我怎么才能把它解放出来？ I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\core\common_runtime\gpu\gpu_device.cc:885] Found device 0 with properties: name: GeForce GTX 1070 major: 6 minor: 1 memo

浏览 2提问于2017-04-10得票数 2

回答已采纳

3回答

Google pro GPU运行极慢

tensorflow、machine-learning、gpu、google-colaboratory

我正在colab Pro GPU上运行一个Convnet。我在运行时选择了GPU，可以确认GPU是可用的。我运行的网络和昨天晚上完全一样，但每次运行大约需要2小时。昨晚每次大约花了3分钟.什么都没有改变。我有一种感觉，colab可能限制了我的GPU的使用，但我不知道如何判断这是否是问题所在。GPU的速度会因时间等而波动吗？以下是我打印的一些诊断信息，有人知道我如何能更深入地研究这种缓慢行为的根本原因吗？我还试着把colab中的加速器换成“None”，我的网络速度和选择的GPU一样快，这意味着由于某种原因，我不再在GPU上训练，或者资源严重受限。我正在使用Tensorflow 2.1。 gpu

浏览 1提问于2020-03-22得票数 5

回答已采纳

1回答

无法创建cudnn句柄: CUDNN_STATUS_ALLOC_FAILED，未能得到卷积算法。这可能是因为cuDNN未能初始化

python、python-3.x、tensorflow、cudnn

我尝试在google中使用Tensorflow GPU加速器，并在我的计算机上使用本地运行时，其中包含以下系统信息操作系统平台和发行版: Windows 10 TensorFlow版本: 2.1 Python版本: 3.6.10 CUDA/cuDNN版本: Cudnn - 7.5.6，CUDA- 10.1 GPU: Nividia Geforce RTX 2060 我在上精确地执行了所有步骤，然后运行这段代码来检查它是否能够发现我的gpu，并查看它和cpu之间的速度差异： import tensorflow as tf device_name = tf.test.

浏览 0提问于2020-08-09得票数 1

2回答

通过Keras / TF 2019限制GPU内存使用？

tensorflow、keras、deep-learning、gpu

我读过这样的答案： import tensorflow as tf from keras.backend.tensorflow_backend import set_session config = tf.ConfigProto() config.gpu_options.per_process_gpu_memory_fraction = 0.2 set_session(tf.Session(config=config)) 但它就是不起作用。在keras和TF中似乎都有如此多的更新，以至于在2017年写的几乎任何东西都不能工作！那么，如何限制内存使用呢？

浏览 18提问于2019-04-22得票数 4

回答已采纳

2回答

Tensorflow2.0 2.0: GPU在超参数调优循环中耗尽内存

python、keras、out-of-memory、tensorflow2.0

我正在尝试对一个用Tensorflow 2.0编写的带有GPU扩展的卷积神经网络进行一些超参数调整。我的系统设置是： Windows 10 64位 GeForce RTX2070，8GB Tensorflow 2.0-beta CUDA 10.0已正确安装(我希望deviceQuery.exe和bandwidthTest.exe都通过了) 我的神经网络有75.572.574个参数，我正在对3777个样本进行训练。在一次跑步中，我在训练CNN方面没有问题。作为下一步，我想调整CNN的两个超参数。为了达到这个目的，我创建了一个for循环(迭代20步)，在这个循环中，我每

浏览 2提问于2019-07-24得票数 3

1回答

在GPU上训练RNN -我应该使用哪个tf.keras层？

python、tensorflow、keras、tf.keras

我正在训练RNN，这是我使用tf.keras.layers.GRU层构建的。他们需要很长时间来训练(>2个小时)，所以我将把他们部署到GPU进行训练。我想知道一些关于GPU训练的事情： tf.keras.layers.CuDNNGRU和tf.keras.layers.GRU (以及tf.keras.layers.LSTM和tf.keras.layers.CuDNNLSTM)有什么区别？我从中了解到，CuDNNGRU层的训练速度比GRU层快，但是层这两层是否在相同的种子下收敛到不同的结果？在推理过程中，这两层是否执行相同的操作？在推理过程中，CuDNN层是否需要GPU？

浏览 1提问于2019-08-05得票数 1

回答已采纳

1回答

以keras和tensorflow为后端在aws sagemaker中配置GPU

tensorflow、keras、amazon-sagemaker

我是aws酿酒师的新手。我正试图在aws中建立一个模型，使用带有GPU支持的keras。下面给出了用于推断模型的码头底图。 FROM tensorflow/tensorflow:1.10.0-gpu-py3 RUN apt-get update && apt-get install -y --no-install-recommends nginx curl ... 这是我用来检查GPU是否被烧瓶中的keras识别的keras代码。 import keras @app.route('/ping', methods=['GET']) def pin

浏览 0提问于2018-12-11得票数 4

回答已采纳

1回答

在PyCharm中运行具有图形处理器支持的Tensorflow时内存不足

python、tensorflow、keras、pycharm

我的代码在iPython终端中运行正常，但由于内存不足错误而失败，如下所示。 /home/abigail/anaconda3/envs/tf_gpuenv/bin/python -Xms1280m -Xmx4g /home/abigail/PycharmProjects/MLNN/src/test.py Using TensorFlow backend. Epoch 1/150 2019-01-19 22:12:39.539156: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructio

浏览 0提问于2019-01-20得票数 4

1回答

如何在tensorflow (keras)中使用GPU和CPU？

python-3.x、tensorflow、memory、neural-network、tf.keras

我正在使用tf.keras运行一个内存紧张(估计约为6GB)的GAN模型，而我的GPU似乎无法处理这个模型(只报告nans，预测失败)。有办法支持我的4GB GPU内存与系统内存吗？还是一种在GPU和CPU之间共享计算工作量的方法？我的规格：操作系统: Windows 10 64 GPU: Geforce GTX 960 (4GB) CPU: Intel Xeon-E3 1231 v3 (4核) Python : Spyder 5 Python: 3.8.5 / 3.8.10在只安装了tensorflow和chess模块的conda环境中 Tensorflow: 2

浏览 2提问于2021-06-07得票数 1

1回答

如何使用浏览器GPU内存？

memory、memory-management、gpu

通过在Chrome上按F12和Esc，你可以看到一些选项。其中之一是显示FPS表，它允许我们实时查看GPU内存的使用情况。关于这个GPU内存的使用，我有几个问题：这个GPU内存意味着网页需要存储代码的内存:变量、方法、图像、缓存的视频等等。这是正确的确认吗？它的上限为512 Mb，有什么原因吗？有办法减少或增加吗？有多少GPU内存使用量足以看到浏览器导航的显著放缓？如果我有一个包含数以百万计的元素的数组(只是假设的)，并且将数组中的所有元素拼接起来，它会释放正在使用的内存吗？或者它不会“真正”释放内存，需要额外的一步才能真正消除它？

浏览 6提问于2015-09-06得票数 1

回答已采纳

1回答

在内存分配方面，多GPU是如何扩展的？

python、tensorflow、keras、deep-learning

我有一台PC，有以下规格：处理器: AMD 2990 Ti (32核)RAM:32 8GB显卡：(GPU:1) GTX1080 Ti(11 8GB)，(GPU:0) GTX1070 (8GB)SSD: 2TB三星Evo 890 我的问题是，当我使用Keras对大约60k图像(GPU:1)运行培训程序时，程序加载图像，数据矩阵为12922.20MB。在此之后，程序一分钟都不做任何事情，并且会自动被杀死。同样的代码似乎也在GPU:1上进行训练，并且可以很好地处理10k图像。可能是因为我的GPU:1只能存储11 my，数据大小在12 my左右？会并行化GPU:1和GPU:0来解决我的

浏览 1提问于2020-11-16得票数 2

5回答

Keras / Tensorflow的低GPU使用率？

tensorflow、gpu、keras

我在一台使用nvidia Tesla K20c图形处理器的电脑上使用keras和tensorflow后端。(CUDA 8) 我正在训练一个相对简单的卷积神经网络，在训练期间我运行终端程序nvidia-smi来检查图形处理器的使用情况。正如您在以下输出中所看到的，GPU利用率通常显示在7%-13%左右我的问题是:在CNN培训期间，GPU的使用率不是应该更高吗？这是否表明keras/tensorflow的GPU配置或使用情况不佳？

浏览 9提问于2017-06-15得票数 18

1回答

库伯奈特斯-在一个失败的状态下，没有人声称拥有一种波德的资源。

kubernetes、jobs

我得到了以下工作模板： apiVersion: batch/v1 kind: Job metadata: name: "gpujob" spec: completions: 1 backoffLimit: 0 ttlSecondsAfterFinished: 600000 template: metadata: name: batch spec: volumes: - name: data persistentVolumeClaim: claimName: &

浏览 4提问于2022-08-30得票数 1

回答已采纳

6回答

Windows上不可预测的CUDNN_STATUS_NOT_INITIALIZED

windows、tensorflow、keras、cudnn

我在Windows 10上的GTX 1070上运行keras神经网络训练和预测。大多数情况下，它是有效的，但偶尔也会出现问题 E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorflow\stream_executor\cuda\cuda_dnn.cc:359] could not create cudnn handle: CUDNN_STATUS_NOT_INITIALIZED E c:\tf_jenkins\home\workspace\release-win\device\gpu\os\window

浏览 2提问于2017-07-12得票数 6

1回答

设备存储器阵列的寿命

python、cuda、gpgpu、numba

我有一个用numba编写的cuda内核，它处理不适合GPU内存的大型数组。因此，我必须多次调用内核来处理整个数组。内核在循环中被调用，在循环中，在GPU完成计算之后，我将结果复制并聚合回主机数组。我的问题：设备数组和复制到GPU内存中的数组的生存期是多少？它们的价值是否保存在一个内核调用另一个内核中？我是否需要将设备数组定义放入循环(在调用内核之前)，还是在进入循环之前只做一次？我是否需要在代码中手动释放/删除设备数组，还是在程序结束时由CUDA内存管理器来完成？谢谢。

浏览 0提问于2019-01-25得票数 1

2回答

Tensorflow的GPU速度比预期慢

python、tensorflow、keras、tensorflow2.0

因此，我最近尝试在具有以下规格的pc上运行tensorflow-gpu： AMD Ryzen 5 2600X 6核，NVIDIA GeForce RTX 2060，带16 GB内存在上的教程中，我用时尚mnist运行了内置的数据集。我运行了以下代码，并注意到colab不能在gpu上运行： print("GPU is", "available" if tf.config.list_physical_devices('GPU') else "NOT AVAILABLE") 所以我看了一遍教程，基本上运行了他们的代码： import

浏览 0提问于2020-08-15得票数 6

1回答

关闭会话后，Tensorflow 1.8内存仍保留在GPU上

c++、tensorflow

在我的公司，我们目前正在开发一个广泛使用图形处理器处理的应用程序:深度学习，自己的CUDA实现和使用DirectX的3D可视化。GPU内存访问对于每个进程都很重要。在使用DeepLearning ( DL )模型时，我们遇到了TensorFlow ( TF )的一个问题:关闭TF与DL模型的会话后，不释放内存。只有当应用程序进程完成时才会释放它。这给我们的应用程序带来了严重的问题，因为DL调用后的其他处理请求由于内存不足而无法完成。我发现有一些解决方案，其中TF会话在另一个进程中启动，但我们担心必须在两个进程之间复制大量内存的性能。有没有其他的TF解决方案，或者新版本有更好的解决方案？

浏览 0提问于2018-12-07得票数 1

1回答

TensorFlow:并行运行几个版本调用TF的Python

python、tensorflow、deep-learning

我正在改进一个Python脚本，它实现了基于Keras + TensorFlow的DQN算法。这是一个非常经验性和尝试性的过程，所以我想在后台运行脚本，同时调整代码中的一些超参数并并行运行第二个版本。如果我现在尝试这样做，我会收到一个错误，因为GPU正在被使用。我使用的服务器通过SSH与英特尔Xeon和一个单一的NVIDIA GeForce GTX 780 GPU。这有可能吗？多么?

浏览 0提问于2018-05-23得票数 0

回答已采纳

3回答

跨多个GPU分发Keras模型

python、tensorflow、keras

我正在尝试创建一个非常大的Keras模型，并将其分布在多个GPU上。需要说明的是，我并不是想把同一模型的多个副本放在多个GPU上；我是想把一个大模型放在多个GPU上。我一直在使用Keras中的multi_gpu_model函数，但基于我在执行此操作时遇到的大量内存不足错误，它似乎只是复制了模型，而不是像我希望的那样分发它。我研究了Horovod，但是因为我有很多windows特定的日志工具在运行，所以我在犹豫是否要使用它。这似乎只剩下tf.estimators可供我使用了。但是，从文档中还不清楚我将如何使用这些估计器来完成我想要做的事情。例如，tf.contrib.distribute中

浏览 48提问于2019-02-06得票数 0

回答已采纳

5回答

无法从keras.utils导入multi_gpu_model

python、neural-network、deep-learning、keras、gpu

我在ubuntu 16.04上安装了tensorflow-gpu 1.2.1和keras。我无法执行以下操作： from kears.utils import multi_gpu_model 有没有人像他们文档的常见问题部分中描述的那样成功地使用了multi_gpu_model？我有一个4GPU机与4个GeForce GTX1080Ti卡，并想使用他们所有的。下面是我得到的错误： import keras.utils.multi_gpu_model --------------------------------------------------------------------

浏览 5提问于2017-10-20得票数 8

1回答

如何为这个python文件使用GPU

python、tensorflow、machine-learning、keras

我有这个python文件，在这里我尝试从头开始训练一个GPT2模型。同样，我想使用gpu加速更快，我不能这样做。将非常感谢您的帮助我的python代码如下所示。 PS :我正在AWS的Sagemaker上运行这段代码，所以我想使用他们的gpu加速。我已经把这个作为参考， import tensorflow as tf from transformers import GPT2Config, TFGPT2LMHeadModel, GPT2Tokenizer from pathlib import Path save_path = 'tokenized_data_clean'

浏览 18提问于2022-01-05得票数 0

回答已采纳

1回答

CUDA错误:内存不足- Python进程使用所有GPU内存

python、tensorflow、keras、nvidia

即使在重启机器后，python3进程(系统范围的解释器)仍使用>95%的GPU内存。请注意，即使没有正在运行的训练脚本，内存消耗也会保持不变，而且我从未在系统环境中使用过keras/tensorflow，只在venv或docker容器中使用过。更新:最后一个活动是执行具有以下配置的NN测试脚本： tensorflow==1.14.0 Keras==2.0.3 tf.autograph.set_verbosity(1) tf.set_random_seed(1) session_conf = tf.ConfigProto(intra_op_parallelism_threads=8,

浏览 101提问于2019-12-17得票数 2

回答已采纳

1回答

Apache是否识别GPU核心？

twitter、cluster-computing、gpgpu、mesos、mesosphere

在推特开源办公室负责人的幻灯片25中，这位演讲者说，Mesos允许追踪和管理甚至GPU (我猜他指的是GPGPU)资源。但我在其他地方找不到这方面的任何信息。有人能帮忙吗？除了Mesos，还有其他集群管理器支持GPGPU吗？

浏览 0提问于2015-01-10得票数 5

回答已采纳

1回答

当我运行tensorflow-gpu时发出警告。它用的是GPU吗？

tensorflow

当我运行这个命令时： sess = tf.Session(config=tf.ConfigProto(log_device_placement=True)) 我收到这张日志： 2017-06-16 11:29:42.305931: W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.1 instructions, but these are available on your machine and could speed up CP

浏览 1提问于2017-06-16得票数 0

回答已采纳

1回答