如何知道哪个GPU tensorflow模型正在进行训练_训练模型出现Tensorflow错误(在GPU上)_Tensorflow gpu无法训练我的Xception模型 - 腾讯云开发者社区

tensorflow2.0

我已经成功地使用fashion_mnist数据集在TensorFlow2.0中训练了一个模型，我想知道如何才能知道它是否在gpu加速的帮助下训练过？

浏览 55提问于2019-06-04得票数 1

2回答

TensorFlow中序列到序列模型的分布式(多设备)实现？

gpgpu、tensorflow、multi-gpu、lstm、recurrent-neural-network

是一个非常好的教程，在TensorFlow中训练序列到序列模型.我只想知道是否有一个分布式版本的，它利用(一组GPU)在单机上获得更好的性能？已经提到，可以训练一个大型的多层递归神经网络(参见图8和“模型并行训练”部分)。有谁知道目前的教程是否涵盖模型并行培训？如果没有，如何改进最初的教程来利用一组GPU？

浏览 2提问于2016-03-03得票数 2

回答已采纳

1回答

CNN模型的可复制性如何？

keras、tensorflow、cnn、gpu、colab

我想用Google (GPU)，Keras和Tensorflow来训练几个CNN架构。由于经过训练的模型由于GPU的支持不能重复，所以我想对模型进行多次训练，并确定结果的均值和标准差。我完全不确定我是否至少应该试着使模型的可重复性最小？例如，在程序开始时使用以下代码： import numpy import tensorflow as tf import random as rn import os os.environ['PYTHONHASHSEED']='0' np.random.seed(1) rn.seed(1) tf.set_random_seed(

浏览 0提问于2019-11-02得票数 1

回答已采纳

2回答

TensorFlow多gpu训练中的模型并行性

tensorflow

我正在使用tensorflow在一台机器上训练几个GPU中的模型。然而，我发现速度比在一个GPU上训练要慢得多。我想知道tensorflow是否在不同的GPU中并行地或顺序地执行子模型。例如： x = 5 y = 2 with tf.device('/gpu:0'): z1 = tf.multiply(x, y) with tf.device('/gpu:1'): z2 = tf.add(x, y) /gpu:0和/gpu:1中的代码是否按顺序执行？如果按顺序排列，如何使这两个部分并行执行？假设这两个部分不相互依赖。

浏览 2提问于2018-04-02得票数 0

回答已采纳

1回答

在Rstudio中加载在Google Cloud ML中训练的tensorflow SavedModel

python、r、tensorflow、keras、google-cloud-platform

我在Google Cloud ML中训练了一个模型，并将其保存为保存的模型格式。我已经附加了下面保存的模型的目录。 https://drive.google.com/drive/folders/18ivhz3dqdkvSQY-dZ32TRWGGW5JIjJJ1?usp=sharing 我试图使用以下代码将模型加载到R中，但它返回的<tensorflow.python.training.tracking.tracking.AutoTrackable>对象大小为552字节，这显然是不正确的。如果任何人可以正确加载模型，我很想知道你是如何做到的。它也应该能够加载到python中，我想这

浏览 10提问于2019-12-13得票数 0

1回答

在单个gpu上，TensorFlow能否训练出一个大于GPU内存的模型？

python、tensorflow、memory、gpu、ram

如果我有一个具有8GBRAM的GPU，并且我有一个TensorFlow模型(不包括培训/验证数据)，即10 8GB，那么TensorFlow可以训练这个模型吗？如果是，TensorFlow是如何做到这一点的？备注：我不是在寻找分布式GPU培训。我想知道单个GPU的情况。我不关心培训/验证数据的大小。

浏览 0提问于2020-12-09得票数 1

1回答

TensorFlow和Keras GPU使用问题

python-3.x、keras、conv-neural-network、tensorflow2.0、ubuntu-20.04

我正在使用现有的模型来训练一个基于Tensorflow和Keras的CRNN模型。我正在使用anaconda-navigator来训练模型。在训练模型时，它似乎没有使用GPU，因为我的GPU使用率为5-6%。我附加了顶级-i命令Nvidia Xserver的图像，而且我的gpu没有被Tensorflow拾取，因为tf.test.gpu_device_name()只显示CPU，如下面的tf.test.gpu_device_name() Tensorflow and Keras Versions in anaconda top -i output屏幕截图所示。

浏览 20提问于2021-01-08得票数 1

2回答

在服务TensorFlow模型的性能中使用GPU有什么影响？

tensorflow-serving、tensorflow

我用GPU (1080 ti)训练了一个神经网络。GPU上的训练速度要比使用CPU好得多。目前，我想使用TensorFlow服务来服务这个模型。我只想知道在服务过程中使用GPU是否对性能有相同的影响？由于培训适用于批处理，但是推断(服务)使用异步请求，您是否建议在使用TensorFlow服务为模型服务时使用GPU？

浏览 12提问于2017-05-23得票数 3

回答已采纳

2回答

如何使用Tensorflow对象检测API启用多GPU训练

tensorflow、deep-learning

我正在尝试使用TensorFlow对象检测应用编程接口执行多GPU训练。我在我的NVIDIA-SMI中看到的是，实际上只有1个GPU被使用。提供的其他3个GPU加载了GPU进程，但内存使用率为300MB，利用率始终为0% 我使用在COCO上预先训练的基于固态硬盘MobileNetV1的网络，然后用我的自定义数据集对其进行训练。我希望当我为Tensorflow提供更多的GPU时，框架实际上会使用它们来加速训练。

浏览 49提问于2019-10-09得票数 3

1回答

如何让Tensorflow使用多路GPU

tensorflow、gpu

我使用Tensorflow训练一个具有3个GPU的模型。但是，我发现它只使用了1。代码没有任何GPU配置，因为我认为Tensorflow会自动检测GPU并自动将计算分配到3个GPU中。它似乎没有像我预期的那样工作。从附加的屏幕截图中，当训练程序开始时，检测到3个GPU，但温度监视器显示只有1个处于活动状态。如何在训练过程中同时使用3个GPU？

浏览 21提问于2017-07-27得票数 0

2回答

如何在Tegra X2上使用TesnorFlow-GPU模型进行推理？

python、tensorflow、tegra、tensorrt、nvidia-jetson

我是Jetson x2董事会的新手。我计划在TX2板上运行我的tensorflow-gpu模型，看看它们在那里的表现如何。这些模型是在GTX GPU机上训练和测试的。在tx2板上，Jetpack full不包含tensorflow。因此，tensorflow需要构建/安装，我已经看过几个教程并尝试过。我的python文件train.py和test.py期望tensorflow-gpu。现在我怀疑，如果在tx2板上安装tensorflow-gpu是正确的选择吗？哦，在TX2上有Nvidia TX2，它将完成部分工作，但是怎么做呢？是这样吗？ tensorflow和tensorRT会合作取

浏览 2提问于2018-11-23得票数 1

回答已采纳

1回答

指定Torch和Tensorflow两种不同的GPU

tensorflow、cuda、pytorch、torch

我在比较两个预先训练过的模型，一个在Tensorflow，一个在Py手电，在一个有多个GPU的机器上。每个型号适合一个GPU。它们都加载在相同的Python脚本中。我如何将一个GPU分配给Tensorflow模型，另一个GPU分配给Py火炬模型？设置CUDA_VISIBLE_DEVICES=0,1只告诉这两个模型这些GPU是可用的--我(在Python猜中)，如何确保Tensorflow采用GPU 0，Pytorch采用GPU 1？

浏览 0提问于2018-09-11得票数 0

回答已采纳

1回答

如何知道哪个GPU tensorflow模型正在进行训练

python-3.x、tensorflow、gpu、tensorflow2.0

我已经安装了tensorflow-gpu来在图形处理器上训练我的模型，并从下面确认了安装。 import tensorflow as tf tf.config.list_physical_devices() #[PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU'), # PhysicalDevice(name='/physical_device:GPU:0', device_type='GPU')] 我开始训练一个图像分类模型，我希望它在GPU上自动运

浏览 51提问于2021-08-13得票数 1

回答已采纳

1回答

Tensorflow GAN估计器在评估时挂起

tensorflow、deep-learning

我以Tensorflow Estimator格式实现GAN。下面是完整的代码。该模型可以正常训练。然而，它似乎永远挂在model.evaluate上。训练后的日志如下所示。 INFO:tensorflow:Starting evaluation at 2018-12-03-02:19:06 INFO:tensorflow:Graph was finalized. 2018-12-03 02:19:06.956750: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1511] Adding visible gpu devices: 0 2

浏览 1提问于2018-12-03得票数 0

1回答

如何改变CUDA_CACHE_MAXSIZE的NVIDIA

python、tensorflow、deep-learning、nvidia

你好，我刚买了新的RTX 3080 GPU。我想用Cuda做我的tensorflow模型。但是当我开始训练这个模型的时候，需要一个多小时的时间才能开始训练它。所以我去了tensorflow网站，上面说要增加CUDA_CACHE_MAXSIZE，但我不知道它在哪里。有人能帮我找到它并把尺寸变大吗？我的GPU是10 is。谢谢!

浏览 6提问于2020-10-22得票数 2

2回答

支持TensorFlow和PyTorch的GPU

tensorflow、pytorch、gpu

好吧，所以我现在做了很多深度学习项目和实习，我从来没有做过大量的训练。但是最近我一直在考虑做一些传输学习，我需要在GPU上运行我的代码。现在我有一个系统与Windows 10和一个专用的NVIDIA GeForce 9.4亿GPU。我在网上做了很多研究，但我还是有点困惑。我还没有在我的系统上安装NVIDIA工具包或cuDNN或tensorflow-gpu。我目前使用tensorflow和Py手电筒来训练我的DL模型。这是我的问题- ，当我在tf或pytorch中定义张量时，默认情况下它是一个cpu张量。所以，到目前为止，我所做的所有训练都是在CPU上进行的。所以，如果我确保安装了正确版本的Cu

浏览 5提问于2020-08-20得票数 1

1回答

TFF占用大量CPU

tensorflow-federated

当我运行没有TFF的代码(使用model.fit()训练我的模型)时，我注意到CPU的使用率是5%，并且我的代码运行GPU。但如果我引入TFF :抛开GPU不谈，训练需要大量CPU (90%的量级)和大量内存，因为我知道我使用的是: Tensorflow Federated v0.12.0 Tensorflow v2.1.0

浏览 4提问于2020-03-02得票数 0

1回答

为什么Tensorflow GPU在创建模型和训练模型时比CPU版本要慢得多？

performance、tensorflow、anaconda

在解释这个问题之前，我首先想给你一些关于我是如何安装tensorflow和其他包的信息。我花了很多时间让tensorflow在我的GPU (Nvidia RTX 3070，Windows 10系统)上运行。首先，我安装了Cuda (v.10.1)，下载了CuDDN (v7.6)，并将cuDNN文件复制并粘贴到正确的Cuda安装文件夹(如下所述：https://docs.nvidia.com/deeplearning/cudnn/install-guide/index.html#install-windows)我想使用tensorflow 2.3.0，并使用页面上的表格检查Cuda和CuDNN

浏览 36提问于2021-03-25得票数 0

1回答

如何在一个程序中运行2种不同的tf.keras模型--一种是在CPU上，另一种是在GPU上

python、tensorflow、keras、deep-learning

我正在训练一个深层次的神经网络模型--让我们称之为模型A- -在我的主要训练脚本train.py上使用train.py。此train.py导入utils.py，其中定义了提供培训过程的数据生成器。utils.py还导入other_utils.py，其中创建并初始化了一个经过预先训练的深层神经网络模型-MODEL B-，因为数据生成器使用它来处理培训数据。模式B的初始化已经使用了大部分GPU内存，给我留下了很少的资源来训练模型A。导入模式如下所示： train.py (MODEL A) --> utils.py (data generator) --> other_utils.p

浏览 3提问于2022-01-10得票数 0

回答已采纳

1回答

如何防止Tensorflow在使用紧急执行时分配整个GPU内存？

tensorflow

我有几乎相同的问题已经回答了，但略有不同：我在一台带有几个GPU的服务器上工作，我与我的同事共享这些GPU来训练我们的深度学习模型。服务器还应该运行一个从我们的模型中采样的小型web应用程序。采样脚本使用相对较新的。从理论上讲，它允许我通过提供如下配置来阻止Tensorflow分配所有GPU内存： config = tf.ConfigProto() config.gpu_options.allow_growth = True tf.enable_eager_execution(config=config) 但在实践中，这是行不通的。急切执行的文档还指出，并不是所有适用于会话的配置选项都能在急

浏览 0提问于2018-11-03得票数 1

1回答

使用GPU时显像板AVX2错误

python、tensorflow、deep-learning、jupyter-notebook

目前，我已经安装了Tensorflow CPU和GPU，用于木星笔记本。在此之前，我使用了CPU版本，因为我不需要GPU的性能.然而，现在我正在用我的GPU训练一个盗梦空间模型，我想访问Tensorboard。我以前使用CPU版本时遇到的问题是错误：Your CPU supports instructions that this Tensorflow binary was not compiled to use: AVX2。我在其他堆栈溢出问题中读过关于AVX2的文章，据我所知，这是由于我使用的Tensorflow的cpu版本。然而，现在我正在使用gpu版本的Tensorflow (在朱庇

浏览 2提问于2018-04-13得票数 0

1回答

Tensorflow-gpu只训练使用1.14版本的自定义对象检测模型

python、windows、tensorflow、machine-learning、artificial-intelligence

我欣喜若狂地发现了一个可以训练和测试我的自定义对象检测模型的设置，但我不明白为什么最新的tensorflow-gpu版本不能在我的PC上工作，而另一个设置在我的笔记本上工作：我正在使用的设置(PC)：操作系统: Windows 10 Python: 3.6.4 TensorFlow: 1.14.0(gpu) 库达: 10 9.0？(不记得了) 回购+定位：我使用的设置(膝上型计算机)：操作系统: OSX Python: 3.7.5 TensorFlow: 2.1.0-rc0(标准) 回购+定位：如何(什么时候？)我能用tenso

浏览 1提问于2020-01-04得票数 2

1回答

是否可以使用Tensorflow 2.1训练模型Tensorflow对象检测API？

tensorflow、object-detection、object-detection-api、tensorflow2.x

在Tensorflow-gpu 2.1上训练模型Tensorflow对象检测API时，有一个错误：没有名为'tensorflow.contrib'的模块是否可以使用Tensorflow 2.1训练模型Tensorflow对象检测API？我不想改变Tensorflow的版本。有人能帮我吗？

浏览 2提问于2020-04-11得票数 1

1回答

使用CPU加载模型权重时内存不足

python、tensorflow、machine-learning、keras、tf.keras

1.我训练了我的GPU深度学习模型。 import keras model.save('trained_model.h5') 和我想要加载模型，并使用模型= load_model('trained_model.h5') 但是得到了以下错误 tensorflow.python.framework.errors_impl.InternalError: CUDA runtime implicit initialization on GPU:0 failed. Status: out of memory 如何在CPU上加载经过训练的模型？

浏览 1提问于2021-01-13得票数 0

回答已采纳

1回答

如何修复:错误:找不到满足需求的版本tensorflow-gpu=1.14.0(版本:无)

python、tensorflow

目前，我在mac os上安装Tensorflow GPU时遇到了问题。我已经卸载了tensorflow 1.14，并试图安装tensorflow 1.14 GPU来训练模型。 (deepspeech-venv) Chabanis-MacBook-Pro:Deepspeech chabani$ pip3 install 'tensorflow-gpu==1.14.0' Collecting tensorflow-gpu==1.14.0 ERROR: Could not find a version that satisfies the requirement tensorf

浏览 0提问于2019-08-20得票数 1

回答已采纳

1回答

Tensorflow / keras multi_gpu_model不分裂为多个gpu

python、tensorflow、keras、multi-gpu

我遇到的问题是，我不能成功地把我的训练批次分成多个GPU。如果使用来自multi_gpu_model的tensorflow.keras.utils，则tensorflow将在所有可用的gpu(例如2)上分配全部内存，但如果监视nvidia，则只使用第一个gpu (gpu)达到100%。我现在用的是tensorflow 1.12 单装置试验 model = getSimpleCNN(... some parameters) model .compile() model .fit() 正如预期的那样，数据由cpu加载，模型在gpu上运行，gpu利用率为97% - 100%：创建mult

浏览 0提问于2019-03-06得票数 0

2回答

如何指定用于保存的模型的设备

c++、tensorflow

我有一个用python tensorflow训练并保存的模型。现在，我想在c++应用程序中执行预测。我像这样加载模型(在Tensorflow 1.3.1上)： std::unique_ptr<tensorflow::SavedModelBundle> bundle(new tensorflow::SavedModelBundle()); tensorflow::Status status = tensorflow::LoadSavedModel( tensorflow::SessionOptions(), tensorflow::RunOptions(), mode

浏览 14提问于2018-01-24得票数 1

回答已采纳

1回答

有没有在tensorflow中“交换”GPU内存的方法？

memory、tensorflow

我正在训练一个大型号，超过GPU内存(超过11 GB)。我想知道tensorflow中是否有将GPU内存转换为主内存的方法。有些效率的损失是可以接受的。完全在CPU上对模型进行训练，解决了内存问题，但速度太慢。

浏览 0提问于2018-03-23得票数 3

0回答

具有多个工人的ML engine上的Keras模型训练

google-cloud-ml

我已经构建了一个语义分割Keras (tensorflow后端)模型，并试图在google cloud ml引擎上对其进行训练。我有大约200,000 (256x256)个图像可以在小批量(10)上训练大约100个时期。当我只使用complex_model_m_gpu类型的主设备时，1个纪元几乎要花25个小时。我不确定Keras模型如何适应多GPU训练设备(例如，complex_model_m_gpu)。没有关于这方面的文档，只有关于分布式TensorFlow培训的文档。我如何最好地利用ML engine上的可用资源来快速训练我的模型？使用多个员工对培训过程有何影响？当我将工作进程添加到我的

浏览 11提问于2018-07-18得票数 2

2回答

如何用Keras在2个GPU上训练更多的模型？

python、keras、tensorflow、gpu

我有2个GPU类型的NVIDIA GTX 1070钛。我想用这样的方式训练更多的模型:一半的模型只在一个GPU上训练，另一半同时在另一个GPU上训练。因此，随着训练的进行，一个模型到GPU1，下一个模型到GPU2，.我不想在这两个GPU上训练一个型号。我在TensorFlow后端使用Keras。你能给我推荐一些资源吗?我能看出来怎么做吗？大多数在线示例/文章只在您想要在两个GPU上分发一个模型时才会涉及到这种情况。谢谢。

浏览 0提问于2019-03-12得票数 0

回答已采纳

2回答

哪些最新的CUDA和cudnn版本兼容tensorflow 1.15 gpu？我在tensorflow网站上找不到

tensorflow、gpu

我正在尝试设置用于gpu计算的系统，以训练深度学习模型。所需的tensorflow版本为1.15 gpu。我想知道我必须在系统中安装哪个版本的CUDA和CUDnn？

浏览 0提问于2020-01-30得票数 0

1回答

TensorFlow时间轴中GPU_0_bfc分配器与GPU_host_bfc分配器的差异

tensorflow、gpu、tensorboard

当我尝试在TensorFlow中分析模型训练的内存使用情况时，我发现TensorFlow时间线工具收集了两个相关信息，GPU__bfc和GPU_host_bfc (见下图)，我想知道哪一个可以最准确地反映内存使用情况？或者它们之间的区别是什么？谢谢。 Sample TensorFlow Timeline Profiling Result

浏览 20提问于2020-03-17得票数 3

1回答

内存错误。GPU上的进程使用CPU/系统内存

python、tensorflow、gpu

在将tensorflow图像更新到过去训练的22.01-tf2-py3，模型之后，现在给我一个内存错误。Tensorflow似乎使用的是系统内存，而不是GPU，程序初始化后停止。在进行了一些研究之后，我发现问题在于在运行GPU时为该进程分配的CPU/系统内存。另外，GPU上的tf进程比数据集的大小占用更多的内存。根据我所读到的，tensorflow将输出张量从GPU内存复制到CPU。我不明白为什么更新图像后会出现这个问题？我怎么才能修好它呢？ #编辑:我的网格搜索循环有太多的参数，当我把它简化为一个模型时，它确实是训练的，有意义吗？当我进入循环时，它是否预先加载所有模型？ #ED

浏览 5提问于2022-02-28得票数 -1

9回答

如何防止tensorflow分配整个GPU内存？

python、tensorflow、tensorflow2.0、tensorflow2.x、nvidia-titan

我在一个共享计算资源的环境中工作，也就是说，我们有几台服务器，每台都配备了几个Nvidia Titan X GPU。对于小到中等大小的模型，12 GB的Titan X通常足以让2-3个人在同一GPU上同时运行训练。如果模型足够小，以至于单个模型没有充分利用GPU的所有计算单元，那么与一个接一个地运行训练过程相比，这实际上可以导致加速。即使在对GPU的并发访问确实减慢了个人训练时间的情况下，拥有多个用户同时在GPU上进行训练的灵活性仍然是很好的。 TensorFlow的问题是，默认情况下，它会在启动时分配全部可用GPU内存。即使是一个小的两层神经网络，我也看到所有12 GB的GPU内存都用完了

浏览 96提问于2015-12-10得票数 330

回答已采纳

1回答

无法将设备分配给节点

python、tensorflow

我跟随将我自己训练过的tensorflow模型导出到c++，当我调用时会出现错误 I tensorflow/core/common_runtime/gpu/gpu_device.cc:838] Creating TensorFlow device (/gpu:0) -> (device: 0, name: TITAN X (Pascal), pci bus id: 0000:03:00.0) ... tensorflow.python.framework.errors.InvalidArgumentError: Cannot assign a device to node 'sa

浏览 5提问于2016-10-05得票数 1

回答已采纳

1回答

使用实例减慢ResNet50训练时间

python、tensorflow、deep-learning、computer-vision、amazon-sagemaker

我正在尝试使用带有tensorflow后端的keras来训练ResNet50模型。我使用的是一个sagemaker实例ml.p3.2xlarge，但是我的培训时间非常长。我使用的是conda_tensorflow_p36内核，我已经验证我安装了tensorflow-gpu。当检查nvidia的输出时，我看到进程在GPU上，但利用率从未超过0%。 Tensorflow也能识别GPU。训练时间截图。虽然使用的是0%，但sagemaker实际上是在使用GPU吗？会不会是由另一个问题引起的？

浏览 1提问于2022-04-13得票数 0

回答已采纳

3回答

当要求Tensorflow符合模型时崩溃

python、tensorflow、jupyter、conda

对于我来说，gpu上的Tensorflow第一个天真的问题是，假设我可以使用gpu (NVGTX1660ti)来运行tensorflow操作，而它同时运行我的监视器，这是正确的吗？只有一个gpu卡在我的个人电脑，假设它可以同时做，还是我需要一个专门的gpu为tensorflow，这是没有连接到任何显示器？所有在ubuntu 21.10上，都设置了nvidia-工具箱，cudnn，tensorflow，tensorflow-gpu在conda env中，所有看起来都工作得很好:1 gpu可见，与cudnn 11.6.r11.6，tf版本2.8.0，python版本3.7.10都在conda e

浏览 32提问于2022-03-19得票数 0

回答已采纳

1回答

如何打印Keras的model.fit()期间使用的最大内存

python、tensorflow、keras、memory

我用Keras和Tensorflow编写了一个神经网络模型，并且能够训练和运行它。此时，我想知道训练模型需要多少内存。如何在培训阶段打印这些信息？我尝试了下面的Keras模型分析器，但它没有解释训练阶段所需的峰值内存。例如，训练我的模型显示在6GB的GPU卡上内存不足，但是配置文件显示内存需求小于1GB。那么，当我在model.fit()中使用Keras时，如何度量运行时的峰值内存需求呢？

浏览 2提问于2022-01-18得票数 2

回答已采纳

2回答

Keras + TensorFlow模型

python、tensorflow、keras

我目前正在创建一个模型，在创建模型的同时，我提出了一些问题。使用相同的数据多次训练相同的模型会不会提高这些对象的精度，因为您每次都会对它进行训练吗？当对象有时达到90%的精度时，当我重新运行它时，它的精度会降低，甚至不能预测正确的对象，那么会有什么问题呢？是因为Tensorflow在GPU上运行吗？

浏览 3提问于2020-05-13得票数 0

回答已采纳

2回答

使用GPU训练模型

python、tensorflow、scikit-learn、gpu

我有一点使用GPU来训练模型的知识。我正在使用scikit-learn中的K-means来训练我的模型。由于我的数据非常大，是否可以使用GPU训练此模型以减少计算时间？或者你能推荐一些使用GPU能力的方法吗？另一个问题是，如果我使用TensorFlow构建K-means，如本文所示。它会不会使用GPU？提前谢谢你。

浏览 2提问于2017-02-01得票数 0

2回答

Keras + Tensorflow:多个gpus上的预测

python、tensorflow、keras、python-multiprocessing

我使用Keras和tensorflow作为后端。我有一个编译/训练的模型。我的预测循环很慢，所以我想找到一种方法来并行化predict_proba调用来加快速度。我想获取一个批次列表(数据)，然后根据可用的图形处理器，在这些批次的子集上运行model.predict_proba()。本质上： data = [ batch_0, batch_1, ... , batch_N ] on gpu_0 => return predict_proba(batch_0) on gpu_1 => return predict_proba(batch_1) ... on gpu_N =>

浏览 3提问于2017-02-23得票数 13

回答已采纳

1回答

Jupyter Notebook GPU内存训练后发布模型

python、memory-management、deep-learning、jupyter-notebook、gpu

在使用Jupyter notebook完成深度学习模型训练后，我们如何清理GPU内存。问题是，无论我使用哪种框架(tensorflow，pytorch)，存储在GPU中的内存都不会被释放，除非我手动终止进程或终止内核并重新启动Jupyter。你知道我们如何通过自动化这些步骤来解决这个问题吗？

浏览 28提问于2021-05-09得票数 2

1回答

我需要在tensorflow和numpy之间切换吗？

tensorflow、machine-learning、deep-learning

数据集是numpy集。一些教程说:因为需要GPU的优势，我们应该将numpy数组改为tensorflow张量。然后使用tensorflow模型。但经过训练后，一些代码使用numpy函数进行测试和交互。但tensorflow官方教程中的代码仍然使用相同的tensorflow模型和tf.dataset进行测试。我想知道:当测试或实时应用时，我应该使用numpy还是tensorflow张量和模型？换句话说，如果不训练，使用tensorflow张量和函数是否会产生一些不良影响？例如:我们使用selected_words =tf.argsort(o_j) 代替 selected_words = np

浏览 0提问于2019-11-13得票数 0

1回答

加载保存的tensorflow模型是否可以节省时间

tensorflow

问题是，我不能让我的电脑在ubuntu系统上运行我的tensorflow-gpu。因为NVIDIA驱动不能安装在ubuntu.So上，所以我在Windows10上运行tensorflow-gpu，但它不支持tensorflow服务。我知道Docker可以帮助我做到这一点，而且我真的安装了它，但是只安装了tensorflow-cpu.如果我只运行tensorflow-cpu版本，速度会非常慢。在这种情况下，我提出了一个想法，我安装了两个tensorflow，一个是GPU版本和系统上，另一个是CPU版本在Docker.GPU版本上用于训练和保存模型，然后CPU版本加载保存的模型。我想知道的是，这种

浏览 1提问于2017-09-08得票数 0

1回答

感流目标检测AI

tensorflow

我正在使用Tensorflow模型的动物园目标检测。SSD MobileNet V2 FPNLite 320x320是我用来训练我的模型的型号。一切顺利，我的模特开始训练，但我收到了一些奇怪的信息。我不知道为什么这个味精会出现。我认为我一半的模型是关于GPU的训练，然后它是切换到CPU，但我不确定。这里是正在出现的消息. tensorflow/core/common_runtime/gpu/gpu_device.cc:1525]创建了设备/作业:localhost/ ：0/：0/：0带9971 MB内存：->设备: 0，NVIDIA GeForce RTX 3060，pci总线id:

浏览 1提问于2022-01-30得票数 0

2回答

获取错误“资源耗尽:当分配形状为[1800,1024，28，28，28]的张量，并在/job上键入浮动时:localhost/.”

tensorflow、out-of-memory、tensorflow2.0、object-detection、object-detection-api

当我的对象检测Tensorflow 2.5GPU模型启动训练时，我得到了一个资源扩展错误。我使用了18张训练图像和3张测试图像。我正在使用的预训练模型是来自Tensorflow动物园2.2的更快的using ResNet101 V1 640x640型号。我正在使用一个带有8GB专用内存的Nvidia RTX 2070来训练我的模型。我感到困惑的是，为什么训练过程在训练集如此小的时候占用了GPU的这么多内存。这是GPU内存的总结，我认为这是一个错误： Limit: 6269894656 InUse: 61034

浏览 4提问于2021-10-12得票数 1

回答已采纳

1回答

TensorFlow Keras顺序应用编程接口GPU使用率

tensorflow、keras

当使用TensorFlow的Keras顺序API时，有没有办法强制我的模型在特定的硬件上进行训练？我的理解是，如果有GPU可用(我安装了tensorflow-gpu )，默认情况下，我会在GPU上进行培训。我是否必须切换到不同的API以获得对模型部署位置的更多控制？

浏览 14提问于2020-01-01得票数 0

回答已采纳

1回答

将Tensorflow模型部署为Windows

tensorflow

我想使用Tensorflow 1.4来满足我的ML建模需求。我的用例要求：在GPU上训练模型<--我知道如何用TF做这个将经过训练的模型部署到一个普通的盒子上--作为运行Windows的.exe on (用于推断)<--我不知道如何做到这一点。有人能告诉我TF 1.4是否支持这一点吗?如果支持，可以告诉我指南或者解释它是如何完成的？

浏览 3提问于2017-12-12得票数 4

1回答

如何访问NiftyNet中预训练模型的中间激活图？

tensorflow、pre-trained-model、niftynet

我可以下载并成功测试包的。然而，这只给了我一个预先训练的网络的最终分割结果，而我也需要访问中间层的输出。根据这个演示，下面这行代码下载了一个预先训练好的模型和一个测试MR卷： wget -c https://www.dropbox.com/s/rxhluo9sub7ewlp/parcellation_demo.tar.gz -P ${demopath} 其中${demopath}是演示文件夹的路径。解压下载的文件将创建一个.ckpt文件，该文件似乎包含预训练的tensorflow模型，但是我无法将其加载到tensorflow会话中。有没有一种方法可以加载预先训练的模型并访问它的所有中间激活

浏览 3提问于2017-10-20得票数 1

1回答