在Tensorflow中，GPU的工作速度比CPU慢，为什么？_Tensorflow:使用GPU比CPU慢的自定义训练循环_在简单的数值运算中，Cuda GPU比CPU慢 - 腾讯云开发者社区

tensorflow

我想使用Tensorflow的transform_graph工具来优化一个图表。我试着从 (以及其他具有类似编解码结构的人)中优化图形。但是，在使用quantize_weights时，优化的图实际上要慢得多，在使用quantize_nodes时则要慢得多。从Tensorflow的文档来看，量化时可能没有任何改进，甚至可能更慢。你知道下面的图表/软件/硬件是否正常吗？以下是我的系统信息，供您参考：操作系统平台和发行版: Linux Ubuntu 16.04 安装自:使用TF源代码(CPU)进行图形转换，使用二进制python(GPU)进行推理。 TensorFlow版本:都使用r

浏览 3提问于2017-10-10得票数 8

回答已采纳

1回答

在prettytensor演示shakespeare.py上CPU比GPU快

tensorflow、prettytensor

我从prettytensor运行演示shakespeare.py，并想知道使用CPU和GPU是如何影响每批培训运行时的。因此，我在local_trainer.py中添加了以下行 tick = time.time() results = sess.run(ops, dict(zip(feed_vars, data))) print('done in %.4f secs' % (time.time() - tick)) 它位于run_model函数的309号线上。然后，我通过设置export CUDA_VISIBLE_DEVICES=""强制在CPU上进行培训。我

浏览 2提问于2016-12-15得票数 1

回答已采纳

1回答

如何正确使用GPU电源？

tensorflow、tensorflow2.0

短版本: Tensorflow Keras模型在特斯拉T4上的训练要比在GTX 970上慢得多(这两种模式都在工作，都经过了nvidia-smi的检查)。长版本:我有两台主机。一种是带有Tensorflow 2.1.0的GTX 970 PC机，另一种是带有特斯拉T4和Tensorflow 2.3.0的GCP平台笔记本。我在它们上运行相同的代码，所有的训练数据都以numpy数组的形式存储在内存中，dtype是相同的('float16')，batch_size也是相同的(8，GTX不会在上面的任何事情上工作，但是我在Tesla上也尝试了64，没有什么区别)。为什么特斯拉的计算能力

浏览 2提问于2020-09-02得票数 2

回答已采纳

1回答

Keras看到我的GPU，但在训练神经网络时不使用它

python、tensorflow、keras、gpu

我的GPU不被Keras/TensorFlow使用。为了使我的GPU与tensorflow一起工作，我通过pip安装了tensorflow-gpu (我在Windows上使用Anaconda ) 我有nvidia 1080 print(tf.test.is_gpu_available()) True print(tf.config.experimental.list_physical_devices()) [PhysicalDevice(name='/physical_device:CPU:0', device_type='CPU'), Physica

浏览 2提问于2019-10-18得票数 7

回答已采纳

1回答

tensorflow实现比火炬的实现慢2倍

python、tensorflow、deep-learning、torch

我试图在tensorflow上实现，而torch实现已经存在。我在默认配置(批处理大小= 6)上使用Titan X pascal进行了测试，平均训练迭代大约为343 ms。我用随机输入/输出代替了tensorflow实现： import tensorflow as tf class stacked_hourglass(): def __init__(self, nb_stack, name='stacked_hourglass'): self.nb_stack = nb_stack self.name = name def

浏览 2提问于2016-12-18得票数 1

回答已采纳

1回答

Tensorflow在GPU上比CPU上慢

tensorflow、keras、gpu、tensorflow2.x

使用带有Tensorflow后端的Keras，我正在尝试训练LSTM网络，在GPU上运行它比在CPU上运行要花费更长的时间。我正在训练一个使用fit_generator功能的LSTM网络。它需要CPU ~250秒每一个时代，它需要GPU ~900秒每一个时代。我的GPU环境中的包包括 keras-applications 1.0.8 py_0 anaconda keras-base 2.2.4 py36_0 anaconda keras-gpu

浏览 0提问于2019-06-25得票数 4

回答已采纳

1回答

构建机器学习服务器

linux、graphics-processing-unit

我们需要使用TensorFlow来训练大型网络，这需要几天才能在GPU上完成。亚马逊提供像p2.16xlarge这样的GPU实例，例如16个GPU (NVIDIA K80)。现在我在想，TensorFlow是否高效地利用了多个GPU，还是使用一个带有一个泰坦X的桌面就像我一样快？这些GPU实例非常昂贵，因此我希望自己构建一台机器(基于Linux)。SLI似乎没有与CUDA一起工作，所以我一次只能使用一个GPU吗？

浏览 0提问于2017-01-13得票数 0

1回答

为什么我的脚本在使用CPU和GPU时具有相同的持续时间？

tensorflow

我使用谷歌云平台Ubuntu 16.04，Cuda 9，Tensorflow与GPU 1.8 我用Adam优化器做了一个梯度下降，对一个5个变量的函数进行了100次迭代，这大约是sigmoid函数的100个项的总和。它需要6-7使用GPU K80和它需要同样的时间使用CPU！我知道它确实在使用GPU (或CPU)，因为我打印用于操作的设备，所以我的脚本产生类似于： add_5/x: (Const): /job:localhost/replica:0/task:0/device:GPU:0在使用GPU和使用CPU时的add_5/x: (Const): /job:localhost/repli

浏览 0提问于2018-05-24得票数 1

回答已采纳

2回答

安装Tensorflow

nvidia、cuda

我的笔记本里有一个GPU nvidia Geforce 820米。我想在我的Ubuntu 16.04上安装tensorflow。我不确定是安装GPU还是非GPU版本？它的计算能力为2.1，但tensorflow要求高于3.0

浏览 0提问于2017-05-12得票数 1

回答已采纳

1回答

如何在GPU上正确运行model.fit？(未被原谅的行为)

python-3.x、gpu、tensorflow2.0、model-fitting

目前，我正在为数据科学做课程。在这里，有下面的示例可以在Tensorflow中训练模型： import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense,Dropout model = Sequential() # Choose whatever number of layers/neurons you want. model.add(Dense(units=78,activation='relu')) model

浏览 2提问于2020-08-16得票数 1

1回答

为什么tf.keras model.fit()初始化需要这么长时间？如何对其进行优化？

python-3.x、tensorflow、tf.keras

使用tensorflow.keras (支持GPU的2.0-Alpha0)，我在新编译的模型和之前保存和重新加载的模型上使用tf.keras.model.fit()的初始化时间都非常长。我相信这是在tf.data.Datasets()已经加载和预处理之后，所以我不明白为什么花了这么长时间，并且TF/Keras没有输出： 2019-04-19 23:29:18.109067: tensorflow/core/common_runtime/gpu/gpu_device.cc:1149] Created TensorFlow device Resizing images and creating

浏览 98提问于2019-04-20得票数 11

3回答

如何在GPU上并行运行多个模型的tensorflow推理？

tensorflow、python、keras

您知道用1 GPU tensorflow对2个python进程进行推断的优雅方法吗？假设我有两个过程，第一个是分类猫/狗，第二个是分类鸟类/飞机，每个过程运行不同的tensorflow模型并运行在GPU上。这两个模型将被给予图像从不同的相机连续。通常，tensorflow将占用整个GPU的所有内存。因此，当你开始另一个过程，它会崩溃，说出内存或失败的卷积CUDA或类似的东西。是否有教程/文章/样例代码来说明如何在不同的进程中加载两个模型，并且两者并行运行？这也是非常有用的，如果你运行一个模型推断，而你正在做一些沉重的图形，例如玩游戏。我也想知道运行模型如何影响游戏。我尝试过使用python

浏览 4提问于2020-03-10得票数 12

回答已采纳

1回答

Tensorflow不使用GPU

python、tensorflow

我目前正在尝试训练一个聊天机器人，更具体地说，。但是当我开始训练聊天机器人时，它使用了我100%的CPU和大约10%的GPU。有没有人知道为什么。我已经安装了tensorflow-gpu并确保我有正确的CUDA和cuDNN版本。我还确保我没有安装基本的tensorflow pip包。我也有我的GPU最新的Nvidia驱动程序。我还试着卸载和重新安装我的所有驱动程序，CUDA，cuDNN，tensorflow-gpu及其所有依赖项和python本身-这些都没有工作。我可以创建一个python脚本并包含with tf.device('/gpu:0');，并使用它创建

浏览 0提问于2019-05-23得票数 3

2回答

keras不使用gpu，但tensorflow使用gpu

python、tensorflow、keras、gpu、cpu

Keras没有使用我的GPU，尽管tensorflow似乎可以很好地运行它。我遵循其他人的建议来检查tensorflow： import tensorflow from tensorflow.python.client import device_lib print(device_lib.list_local_devices()) 这给了我们 [name: "/device:CPU:0" device_type: "CPU" memory_limit: 268435456 locality { } incarnation: 1354124348327580223

浏览 2提问于2018-10-23得票数 0

1回答

简单地说，GPU、Nvidia驱动程序、CUDA和cuDNN在使用深度学习框架时的关系是什么？

tensorflow、pytorch、cuda、gpu、nvidia

我一直在谷歌( Google )或学校集群上做深入的学习，所有的事情都做得很好。最近，我需要建立一个工作站来从头开始深入学习，我意识到我对在GPU上运行一个框架(如tensorflow或py手电筒)所需要安装的东西的理解非常有限。那么，谁能用简单的术语来解释，英伟达司机、数据自动化系统和cuDNN的目的是什么？它们是如何一起工作的，或者是在彼此之上的，为什么我需要为tensorflow/Py手电筒安装它们呢？

浏览 8提问于2022-07-22得票数 -4

2回答

Tensorflow的while循环在GPU上运行缓慢？

tensorflow

由于未知的原因，下面的代码在GPU上比在CPU上慢两倍。有人能解释一下原因吗： import time import tensorflow as tf with tf.device('/device:GPU:0'): # gpu takes: 5.132448434829712 seconds # with tf.device('/cpu:0'): # cpu takes: 3.440524101257324 seconds i = tf.constant(0) while_condition = lambda i: tf.less(

浏览 0提问于2018-06-20得票数 5

1回答

Tensorflow不对一个数据集使用GPU，而对非常相似的数据集使用GPU

tensorflow、gpu

我正在使用TensorFlow来训练一个使用来自两个来源的数据的模型。对于这两个源，训练和验证数据的形状几乎相同，整个数据类型都是np.float32。奇怪的是，当我使用第一个数据集时，我机器上的GPU会被使用，但当我使用第二个数据集时，GPU不会被使用。有没有人对如何调查有什么建议？ print(s1_train_data.shape) print(s1_train_data.values) (1165032, 941) [[ 0.45031181 -0.99680316 0.63686389 ..., 0.22323072 -0.37929842 0. ] [-0

浏览 27提问于2017-02-10得票数 1

回答已采纳

2回答

如何使用纯python激活google colab gpu

python、deep-learning、gpu、google-colaboratory

我是谷歌colab的新手。我正试图在那里做深度学习。我已经编写了一个类来创建和训练LSTM网络，只使用python -而不是任何特定的深度学习库，如tensorflow，pytorch等。我认为我使用的是gpu，因为我在colab中选择了正确的运行时类型。然而，在代码执行期间，我有时会收到退出gpu模式的消息，因为我没有使用它。那么，我的问题是:如何使用google colab gpu，只使用普通的python，而不使用特殊的ai库？有没有像“装饰器代码”这样的东西放在我的原始代码中，以便激活gpu？

浏览 2提问于2020-03-16得票数 4

2回答

TensorFlow:分配给cpu而不是gpu的关键图形操作

python、tensorflow

我已经实现了一个TensorFlow DNN模型(两个隐藏层，其中有在MNIST上训练的elu激活函数)，以便用自己的优化例程和工具将TF调用包装在另一个库中。在TeslaK20上运行一些测试时，我注意到GPU的使用占总容量的4%。因此，我更仔细地观察了日志设备的放置情况，并发现所有关键操作(如MatMul、Sum、Add、Mean等)都分配给了CPU。想到的第一件事是，这是因为我在使用dtype=float64，所以我改用了dtype=float32。虽然分配给GPU的操作更多，但仍有大量的操作分配给CPU，如Mean、gradient/Mean_grad/Prod、gradient/M

浏览 4提问于2016-02-16得票数 3

回答已采纳

1回答

通过conda伪造安装tensorflow-gpu使用只使用CPU的tensorflow

python、tensorflow、conda

我正在创建一个conda环境，仅用于从tensorflow-gpu通道使用conda-forge包。 conda create -n tst -c conda-forge tensorflow-gpu 这将导致安装tensorflow-gpu 和 tensorflow包： The following NEW packages will be INSTALLED: _tflow_1100_select: 0.0.1-gpu ... tensorboard: 1.10.0-py36_0 conda-forge tensorflow:

浏览 0提问于2018-09-20得票数 5

2回答

比较CPU和GPUs它总是有意义吗？

benchmarking、cpu、gpu、intel、nvidia

我正在阅读的GPU速度和CPU速度。既然CPU有很多GPU不需要承担的责任，为什么我们一开始就把它们进行比较呢？这句话“我想不起来第二次我看到一家公司推广的竞争基准是一个数量级的慢”，这句话听起来像是英特尔和NVIDIA都在生产GPU。显然，从程序员的角度来看，您想知道将您的应用程序移植到GPU是否值得您的时间和精力，在这种情况下(公平)比较是有用的。但是，总是用来比较它们吗？我想要的是一个技术解释，解释为什么英特尔会像安迪基恩( Andy )所认为的那样，推广他们的速度比NVIDIA更慢的基准。

浏览 4提问于2012-02-10得票数 0

回答已采纳

2回答

Tensorflow性能(版本1 vs 2和CPU与GPU)

python、performance、tensorflow、tf.keras

我是机器学习的新手，我发现自己花了不成比例的时间来设置Tensorflow。我使用Anaconda作为环境管理不同的版本。我设法安装了 Tensorflow-cpu_1.14.0 Tensorflow-gpu_1.14.0 Tensorflow-cpu_2.0.0-beta1 1。由于CUDA驱动程序的一些问题，我没有建立Tensorflow-gpu_2.0.0-beta，我暂时放弃了这个。我的目标是确保上述三个版本正常工作，并使用系统上的所有可用资源。特别是，我的问题是：如何可靠地衡量现有计算机和Tensorflow设置的性能？举个例子，我只使用CPU版本

浏览 0提问于2019-08-26得票数 4

回答已采纳

1回答

Tensorflow对象检测API，仅在CPU上运行，错误忽略节点‘/device:GPU:0’的设备规范prefetch_queue_Dequeue。

tensorflow、object-detection-api

当我开始训练时，这个过程只发生在CPU上。当它开始的时候，这就是我得到的信息：忽略节点“prefetch_queue_Dequeue”的设备规范prefetch_queue_Dequeue，因为“prefetch_queue”的输入边是一个引用连接，并且已经将设备字段设置为/device:CPU:0 当GPU内存被填满时，gpu的负载只会突然增加，且大部分为0%。不用说，演出非常缓慢。似乎所有的东西都加载到CPU上，而不是GPU，因为CPU利用率几乎是100%：我还注意到在ubuntu中也存在同样的问题，但它至少比windows分支快4倍(每一步花费400 ms，

浏览 0提问于2017-09-17得票数 0

回答已采纳

1回答

TensorFlow GPU:没有提高HelloWorld代码的性能

python、python-3.x、tensorflow

背景我是TensorFlow的新开发人员。系统规格： i5-7200U CPU @ 2.50GHz×4 GeForce 940MX4GB Ubuntu 18 我在Docker上运行TensorFlow (发现安装cuda的东西太复杂了，而且很长时间，可能我搞砸了) 基本上，我是在GPU和CPU上运行一种HelloWorld代码，并检查它会有什么样的差异，令我惊讶的是，几乎没有任何差别！ docker-compose.yml version: '2.3' services: tensorflow: # image: tensorflow/t

浏览 0提问于2018-11-18得票数 0

回答已采纳

1回答

Tensorflow-directml vs tensorflow-CPU

python、tensorflow、keras、deep-learning

我现在开始用Tensorflow学习Python中的CNN。我理解Tensorflow使用CUDA，所以我尝试使用Tensorflow-directml，因为我使用的是AMD (RX 580和I3 10100 f CPU)。我尝试使用CIFAR-10数据集为对象检测建立一个基本模型： model = models.Sequential() model.add(layers.Conv2D( 32, (3,3), activation='relu', input_shape=(32,32,3) ) ) model.add(layers.MaxPooling2D( (2,2) ))

浏览 4提问于2022-04-06得票数 0

2回答

为什么我的OpenCV数据自动化系统在简单的阈值处理方面比CPU运行慢？

opencv、cuda、gpu

我的CPU是Intel Core2 Duo T5550，GPU是GeForce 8400 m G. CUDA版本5.5.22，OpenCV版本2.4.8。测试代码如下： double t = (double)getTickCount(); gpu::threshold(src, dst, thres, binMax, THRESH_BINARY); t = ((double)getTickCount() - t)/getTickFrequency(); cout << "Times passed in seconds: " << t <<

浏览 0提问于2014-01-08得票数 0

回答已采纳

1回答

我是否在使用gpu进行培训？

python-3.x、tensorflow、keras、gpu

我正在训练一个神经模型，使用keras和tensorflow作为后端。日志文件以以下消息开头： nohup: ignoring input 2019-02-12 17:44:29.414526: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 AVX512F FMA 2019-02-12 17:44:30.191565: I tensorflow/core/c

浏览 26提问于2019-02-13得票数 3

1回答

亚马逊网络服务P3比使用Keras、TensorFlow和MobileNet的本地GPU慢

python、amazon-web-services、tensorflow、amazon-ec2、keras

我目前正在使用keras和tensorflow训练(微调)一个预先训练好的MobileNet模型。训练是在我的本地计算机上使用GTX980完成的。为了加快速度，我使用基于Ubuntu ()的Amazon Deep Learning AMI在亚马逊网络服务上创建了一个p3.2xlarge实例。当运行一些测试数据(大约300张图片)时，我注意到我的本地计算机每个时期需要大约10秒，而aws需要26秒。我甚至用一个p3.16xlarge实例对它进行了测试，但没有太大的区别。使用观看GPU时 watch -n 1 nvidia-smi 所有内存(每个GPU 16 GPU)都已满。我尝试了不同的数

浏览 15提问于2018-08-16得票数 0

2回答

Matlab + CUDA求解矩阵向量方程A*x=B的速度慢

performance、matlab、matrix、cuda、linear-algebra

我正在计算一个方程A*x=B，其中A是一个矩阵，B是一个向量，x是答案(未知)向量。硬件规格:英特尔i7 3630QM (4核)、nVidia GeForce GT 640M (384个CUDA核) 下面是一个例子： >> A=rand(5000); >> B=rand(5000,1); >> Agpu=gpuArray(A); >> Bgpu=gpuArray(B); >> tic;A\B;toc; Elapsed time is 1.382281 seconds. >> tic;Agpu\Bgpu;toc

浏览 2提问于2013-02-16得票数 6

2回答

TensorFlow中的SVD比numpy慢

python、numpy、tensorflow、svd

我观察到，在我的机器上，tensorflow中的SVD运行速度比在numpy中慢得多。我有GTX 1080 GPU，并且期望SVD至少和使用CPU (numpy)运行代码的速度一样快。环境信息操作系统 lsb_release -a No LSB modules are available. Distributor ID: Ubuntu Description: Ubuntu 16.10 Release: 16.10 Codename: yakkety 已安装的CUDA和cuDNN版本： ls -l /usr/local/cuda-8.0/lib64/libcud* -rw-

浏览 10提问于2017-09-21得票数 1

回答已采纳

1回答

内存不足的GPU

amazon-web-services、tensorflow、keras、gpu

我只想把细节也贴在这里。但基本上，我有一个正在耗尽内存的实现。此处参考的Github问题：这是错误消息： UserWarning: Viewer requires Qt warn('Viewer requires Qt') 2018-11-12 09:30:54.179843: I tensorflow/core/platform/cpu_feature_guard.cc:141] Your CPU supports instructions that this TensorFlow binary was not compiled to use: AVX2 FMA 20

浏览 1提问于2018-11-13得票数 1

2回答

如何用tensorflow2和keras在多gpus上训练模型？

tensorflow、keras、gpu、tensorflow2.0

我有一个LSTM模型，我想训练多个gpus。我对代码进行了转换，在nvidia-smi中，我可以看到它正在使用所有gpu的所有内存，每个gpu都在使用大约40%的内存，但每批培训的估计时间几乎与1个gpu相同。有人能引导我，告诉我如何在多个gpus上进行适当的训练吗？我的代码： import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense from tensorflow.keras.layers import LSTM fro

浏览 26提问于2019-11-28得票数 1

回答已采纳

1回答

简单DQN慢速训练

python、tensorflow、keras、deep-learning、openai-gym

我一直试图用本文中的DQN来解决OpenAI月球着陆器的游戏。问题是训练50集需要12个小时，所以一定是出了问题。 import os import random import gym import numpy as np from collections import deque import tensorflow as tf from tensorflow.keras.models import Sequential from tensorflow.keras.layers import Dense from tensorflow.keras.optimizers import Ada

浏览 4提问于2021-01-03得票数 3

3回答

为什么基于GPU的算法执行得更快

cuda、gpgpu、nvidia

我刚刚在GPU上实现了一个算法，可以计算数组的连续索引的差值。我将其与基于CPU的实现进行了比较，并注意到对于大型阵列，基于GPU的实现执行得更快。我很好奇为什么基于GPU的实现执行得更快。请注意，我知道表面上的推理，即GPU有多个内核，因此可以执行并行操作，即，我们可以分配一个线程来计算每个索引的差异，而不是顺序地访问每个索引。但是谁能告诉我为什么GPU的执行速度更快的更深层次的原因。他们的体系结构有什么不同之处，以至于可以击败基于CPU的实现

浏览 5提问于2012-02-11得票数 4

回答已采纳

1回答

计算GPU (Tesla K40c)比图形GPU (GTX 960)慢。

tensorflow、deep-learning、keras、gpu

我正在两台不同的机器上运行深度学习CNN (4-CNN层和3个FNN层)模型(用Keras编写，tensorflow作为后端)。我有两台机器(A:使用GTX 960图形GPU，内存和时钟速度为2GB : 1.17 GHz和B:使用特斯拉K40计算GPU，内存和时钟速度为745 GHz)，但当我在A上运行CNN模型时： Epoch 1/35 50000/50000 [==============================] - 10s 198us/step - loss: 0.0851 - acc: 0.2323 关于B： Epoch 1/35 50000/50000 [========

浏览 0提问于2018-02-02得票数 6

2回答

在训练机器学习模型时，GPU利用率低的原因是什么？

machine-learning、deep-learning、pytorch、gpu、cpu

假设服务器上有8个gpus。(由0至7) 当我在gpu #0上训练一个简单的(小的)模型时，每小时大约需要20分钟。但是，当我在一些gpu上加载5或6个以上的模型时，例如，从gpu #0到#2的每个gpu有2个实验，(总共6个)每个时代的训练时间都会爆炸。(约1小时) 当我为所有gpu训练两台gpu(总共16个实验)时，大约需要3个小时才能完成一个时代。当我看到CPU的利用率时，它是好的。但是GPU的利用率下降了。下降的原因是什么，我如何解决这个问题？

浏览 15提问于2022-09-03得票数 0

回答已采纳

1回答

TensorFlow运算与Numpy乘法的时间比较

python、performance、numpy、matrix、tensorflow

我一直在努力优化我的计算；对于我尝试过的大多数操作，tensorflow都要快得多。我试图做一个相当简单的operation...Transform矩阵(将每个值乘以1/2，然后将1/2加到该值中)。在@mrry的帮助下，我能够在tensorflow中执行这些操作。然而，令我惊讶的是，numpy方法明显更快？！对于数据科学家来说，tensorflow似乎是一个非常有用的工具，我认为这有助于澄清它的用途和优势。我不是以最有效的方式使用tensorflow 数据结构和操作吗？，我不知道非tensorflow方法会有多快。我使用的是2012年中期Macbook Air 4GB内存 trans1

浏览 7提问于2016-03-02得票数 0

回答已采纳

2回答

为什么MobileNetV2只在移动设备上比MobileNetV1更快？

tensorflow、mobile、gpu

我正在研究谷歌全新的MobileNetV2架构。在学习期间，我在Tensorflow模型动物园读过这个字符串例如，Mobilenet V2在移动设备上比Mobilenet V1快，但在桌面GPU.‘上稍微慢一些。所以我的问题是这怎么可能？我真的很想知道为什么。

浏览 0提问于2018-05-17得票数 4

回答已采纳

1回答

Tensorflow 1.15后-无需安装tensorflow-gpu软件包

tensorflow

问题请确认在1.15 tensorflow-gpu后使用TensorFlow 的CPU和GPU，安装tensorflow软件包就足够了，并且不再需要。背景仍然可以看到声明安装tensorflow-gpu的文章，例如pip install tensorflow-gpu==2.2.0和与最新的tensorflow-GPU2.4.1一起活动。 Annaconda文档还提到了tensorflow-gpu包。 TensorFlow是一个通用的机器学习库，但最受欢迎的是深度学习应用程序。Anaconda中有三种支持tensorflow软件包的变体，其中之一是NVIDIA GPU版本。

浏览 16提问于2021-04-14得票数 3

回答已采纳

1回答

不使用GPU的Tensorflow代码

python、tensorflow、gpu、nvidia

我有一个在Ubuntu14.04上运行的Nvidia GTX 1080。我试图用tensorflow 1.0.1实现一个卷积的自动编码器，但是这个程序似乎根本不使用GPU。我使用watch nvidia-smi和htop验证了这一点。运行程序后的输出如下： 1 I tensorflow/stream_executor/dso_loader.cc:135] successfully opened CUDA library libcublas.so.8.0 locally 2 I tensorflow/stream_executor/dso_loader.cc:135] successfu

浏览 1提问于2017-04-20得票数 0

回答已采纳

1回答

用pip安装Tensorflow

python、tensorflow、pip

我用pip安装了tensorflow pip3 install --upgrade tensorflow-gpu 当我在蟒蛇的时候 import tensorflow 我得到了错误。我有最新版本的python和windows 10 x64。

浏览 4提问于2017-07-10得票数 0

3回答

Tensorflow GPU与CPU安装库的差异

python、tensorflow

最近，我想把我的Python库移动到一个悬臂驱动器上，这样在我的工作站和笔记本之间切换时，所有的库都保持不变。(另外，如果我更新了一个，它也会在另一个上更新。) 为此，我在我的挂盘上安装了tensorflow-gpu版本(我的笔记本没有GPU)。在PC (它检测并使用我的GPU没有问题)和笔记本电脑(它自动使用我的CPU)上，一切都运行得很好，没有问题。这就是我的问题所在。这两者的区别是什么？ tensorflow-gpu 然后就 tensorflow ？(因为找不到GPU时，tensorflow-gpu会自动使用CPU版本。) 区别仅仅在于GPU的支持吗？那么为什么要有一个非GPU版本的

浏览 1提问于2018-10-03得票数 35

回答已采纳

2回答

如果我有AMD显卡，如何使用tensorflow-gpu版本？

python-3.x、tensorflow、image-processing、anaconda、object-detection

我在Windows10中使用的是Anaconda，无法安装当前版本的tensorflow-gpu。我有4 GB的AMD Radeon显卡。那么，如何在我的笔记本电脑上运行Tensorflow-gpu版本呢？

浏览 2提问于2018-10-11得票数 2

1回答

tensorflow装置

nvidia

我正在尝试在我的ubuntu14.04中安装tensorflow，并遵循安装指南https://www.tensorflow.org/versions/r0.12/get_已开始/开始_Setup.html#配置-安装下载TF源代码后，我刚刚运行./configure，并且有人问我是否要用TensorFlow来构建OpenCL支持？-我在上面的链接中没有看到这样的选项。当我在我的ubuntu个人电脑上配置时，我看到了新的选择。我是新的GPU和TF编码。它应该在OpenCL支持下运行吗？

浏览 0提问于2016-12-02得票数 0

1回答

丹索尔·弗洛。同一台机器上的一组GPU和同一型号的GPU工作良好，另一组则得到OOM错误。

tensorflow、out-of-memory、multi-gpu

我正在使用多个GPU (num_gpus = 4)来训练一个模型与多个塔。该模型在一组GPU上进行了良好的训练：CUDA_VISIBLE_DEVICES = 0,1,2,3，而在第一次图求值时得到了CUDA_VISIBLE_DEVICES = 0,1,4,5的OOM问题。有人知道为什么会这样吗？下面的选项用于创建会话 session_config=tf.ConfigProto( allow_soft_placement=True, log_device_placement=False) session_config.gpu_options.per_process_gpu_memor

浏览 3提问于2017-04-15得票数 0

4回答

在Tensorflow GPU中训练一个比CPU慢的简单模型

python、tensorflow、gpu

我在Tensorflow中建立了一个简单的线性回归问题，并在1.13.1中使用Tensorflow CPU和GPU创建了简单的conda环境(在NVIDIA P600的后端使用CUDA 10.0 )。然而，看起来GPU环境总是比CPU环境花费更长的时间。我正在运行的代码如下。 import time import warnings import numpy as np import scipy import tensorflow as tf import tensorflow_probability as tfp from tensorflow_probability import ed

浏览 0提问于2019-04-18得票数 13

回答已采纳

3回答

Tensorflow-gpu问题(CUDA运行时错误:设备内核映像无效)

python、tensorflow、gpu、nvidia

我有一个python虚拟环境(conda)，我已经在其中安装了CUDA工具包10.1.243和tensorflow-gpu 2.3.0rc0。我的CUDA驱动程序是11.0。为了测试tensorflow是否正确安装到GPU，我在venv中运行了一系列命令： tf.test.is_built_with_cuda() 真的 tf.config.list_physical_devices(‘GPU’) 找到具有属性的设备0: pciBusID: 0000:01:00.0名称: Quadro M2000M computeCapability: 5.0 PhysicalDevice(名称=‘/phys

浏览 0提问于2020-08-03得票数 7

1回答

与不带AVX和AVX2的tensorflow-gpu相比，它的速度有多快？

performance、tensorflow

与不带AVX和tensorflow-gpu和AVX2的AVX2相比，AVX和AVX2的速度有多快？我试着用谷歌找到一个答案，但没有成功。很难重新编译tensorflow-gpu for Windows。所以我想知道这是否值得。

浏览 1提问于2017-09-10得票数 14

回答已采纳

1回答

如果上一步在GPU上运行，则渲染脚本内部会变慢

android、renderscript

我的dev env如下： Device: Nexus 5 Android: 4.4.2 SDK Tools: 22.6.1 Platform Tools: 19.0.1 Build tools: 19.0.3 Build Target: level 19 Min Target: level 19 我在做一些图像处理应用程序。基本上，我需要对图像进行预处理步骤，然后使用卷积5x5对图像进行过滤。在预处理步骤中，我成功地使脚本在GPU上运行，并取得了良好的性能。因为Renderscript提供了一个5x5的卷积内部函数，所以我想使用它来使整个管道尽可能快。然而，我发现在预处理步骤之后使用5x5卷积

浏览 0提问于2014-04-01得票数 0

1回答

GPU对TFJS的要求:尝试比较TFJS节点和TFJS节点GPU的性能

tensorflow、gpu、tensorflow.js、tfjs-node

我尝试使用NVIDIA GeForce RTX GPU PC卡与TFJS一起工作，并遵循中所述的硬件和软件要求，但我还没有看到性能上的巨大差异。好像是在忽略GPU。我不确定是否遵循了正确的准则，因为上面的文档似乎是针对Tensorflow Python的。我是否需要为使用TensorFlow.js节点的GPU版本做一些更多的设置？

浏览 3提问于2022-05-26得票数 0