tensorflow-gpu无法执行某些单元，因为t= tf.Variable(5)，但可以检测到我的gpu

、、

以下是我的规格： Ubuntu 20.04 试用tensorflow-gpu版本2.0至2.5 使用conda下载的cuda和cudnn : cuda 10.1，cudnn 7.6.5 我一步一步地遵循了这篇教程在某些版本中，tf会检测我的gpu： print(device_lib.list_local_devices()) device_type: "CPU":0

浏览 21提问于2021-07-29得票数 0

回答已采纳

7回答

哪一个TensorFlow和CUDA版本组合是兼容的？

、、、、

我注意到一些较新的TensorFlow版本与旧的CUDA和cuDNN版本不兼容。是否存在兼容版本的概述或官方测试的组合列表？我在TensorFlow文档中找不到它。

浏览 3提问于2018-05-31得票数 293

回答已采纳

2回答

深入分析CPU和GPU之间的差异

、、、、

我一直在寻找CPU和GPU之间的主要区别，更准确地说，是cpu和gpu之间的细微差别。例如，为什么不使用多个gpu而不是gpu，反之亦然。为什么gpu在处理计算时比cpu“快”？有哪些类型的事情，其中一个可以做，另一个不能做或不能有效地做，以及为什么。请不要回复像“中央处理器”和“图形处理器”这样的答案。我正在寻找一个深入的技术答案。

浏览 0提问于2011-10-08得票数 12

回答已采纳

1回答

Tensorflow在被Ray worker调用时无法检测GPU

、、、、

当我尝试下面的代码示例来使用Tensorflow和Ray时，Tensorflow在被“远程”工作人员调用时无法检测到我机器上的GPU，但在“本地”调用时它确实找到了GPU。我把“远程”和“本地”放在引号里，因为所有的东西都在我的桌面上运行，这台桌面有两个图形处理器，运行的是Ubuntu16.04，我使用tensorflow-gpu Anaconda包安装了Tensorflowlocal_network似乎对日志中<e

浏览 0提问于2018-01-27得票数 7

回答已采纳

1回答

_get_hyper和_set_hyper在TensorFlow优化器中是什么？

、、、、

我在优化器中没有看到这些--它们是可选的吗？在创建自定义优化器时，应该还是不应该使用它们？

浏览 3提问于2020-05-27得票数 3

回答已采纳

1回答

Keras (tensorflow)找到GPU，但仅在带有Cuda 10.1的cpu上运行

、、

已经发布了很多关于这个问题的帖子，但没有一个真正回答我的问题，或者与我遇到的问题有一点不同。我在ubuntu 18.04上，按照CUDA 10.1和tensorflow-gpu的默认说明安装了keras。当运行tensorflow检测到我有一个GPU时，但是当我检查cpu和gpu的使用情况时，他似乎仍然只在cpu上运行。我偶然发现了this线程并运行了这个脚本。这证实了我的猜测，他因为</e

浏览 16提问于2019-09-20得票数 4

回答已采纳

4回答

如何使用CUDA通过密集向量积加速稀疏矩阵，目前是通过scipy.sparse.csc_matrix.dot实现的？

、、、、

我的最终目标是在Python中加速矩阵向量乘积的计算，可能是通过使用支持CUDA的GPU。矩阵A约为15k x 15k且稀疏(密度约为0.05)，向量x为15k个元素且密集，我正在计算Ax。我必须多次执行此计算，因此使其尽可能快将是理想的。我目前的非GPU“优化”是将A表示为scipy.sparse.csc_matrix对象，然后简单地计算A.dot(x)，但我希望在连接了几个NVIDIA GPU的VM上加速这一过程

浏览 9提问于2018-02-28得票数 6

1回答

哪个有更好的表现，为什么？

、

也就是一个场景中的所有图形都是以最少可能的方式绘制的，Aka /drawElements调用(理想情况下是1)。部分内容包括允许根据属性来确定纹理。因此，在我的片段着色器中，我考虑了两个场景：precision mediump float; // Represent

浏览 2提问于2013-11-15得票数 3

回答已采纳

4回答

GLSL和GPU片段着色器执行中的求和面积表

、、、

我以前确实在CPU上实现了该算法的一个版本，但我对如何在GPU上实现该算法感到有点困惑。R) and original gray value (G)}我知道在GPU上计算前缀和的常用方法是在两次传递(垂直/水平

浏览 7提问于2016-04-18得票数 2

回答已采纳

3回答

使用(一些)全局变量而不是静态函数变量来初始化值？

、、、、

我想出了两个方法： _initData = initData; } (假设0在initData的有效数据范围之外，并且我没有显示额外的代码，以确保在没有首先启动函数的情况下第一次调用函数时会引发错误。)这两种方法的优缺点是什么?有没有更好的</e

浏览 0提问于2013-08-23得票数 0

12回答

Windows上的TensorFlow：“无法打开CUDA库cudnn64_5.dll”

、、

我安装了gpu版本以及CUDA 8.0和python 3.5。，在我导入tensorflow之后，我得到了以下错误：I c:\tf_jenkins\home\workspace\release-win\device\gpusuccessfully opened CUDA library cublas64_80.dll locally I c:\tf_jenkins\home\workspace\release-win\device\gpu\os\windows\tensorfl

浏览 1提问于2016-12-07得票数 17

1回答

Tensorflow-gpu错误: InvalidArgumentError:无法为操作“MatMul”分配设备

、、

GPU:0'): b = tf.constant([1,2,3,4,5,6],shape=安装了pip install tensorflow-gpu。IPython记事本用于执行上述代码，并不断获取错误。b)]] MatMul操作符似乎无法加载到GPU上。我不知道为什么GPU设备没有支持的内核，

浏览 1提问于2017-11-18得票数 2

回答已采纳

1回答

子类GRUCell调用方法中的tf.keras.Model循环

、、、、

为了让我的循环输出'y_t'，我在循环的每一次迭代之后更新一个tf.Variable。请注意，我不能简单地使用tf.keras.layers.GRU，因为我正在尝试实现这个。本文不只是将x_t传递给RNN中的下一个单元，而是在for循环中作为一个步骤执行一些计算(它们在PyTorch中实现)，并将计算结果传递给RNN单元。他们最终基本上是这样做的: h_t =

浏览 1提问于2021-08-05得票数 0

回答已采纳

1回答

合同以外的输入值是否应该进行单元测试？

、

这种断言不应该进行单元测试(即使使用EXPECT_DEATH宏)，因为单元测试也是正确使用函数的文档，并且不允许使用NULL。我们可以这样总结双方的论点：使用错误日志，我们不仅可以很容易地找到检测到NULL的函数，还可以很容易地找到它的调用位置(伪堆栈跟踪)，从而大大简化了调试。如果在测试中检测到断言(我们没有预料到，这完全是由于代码中的</em

浏览 1提问于2014-04-08得票数 1

1回答

MATLAB:是否有可能重载本机构造(单元、结构等)上的运算符？

、、、

我正在使用单元格来管理我正在处理的一些东西中的数据。为此创建一个新类似乎有点过分，因为我只想为单元格上的数学运算符提供一个定义。如果我写一个类来做这件事，它肯定会使编写代码变得更容易。我看到的最大的负面影响与优化有关，尽管还有一些其他的事情困扰着我。任何在幕后进行的优化(例如，当Jacket编译要在GPU上运行的东西时)

浏览 1提问于2011-03-20得票数 17

回答已采纳

2回答

如何在总是计算为false的Perl条件中检测不可达的代码？

、

我是Perl的新手，目前的任务是整理和维护一个大型的、相当混乱的Perl项目。我正在使用perl-critic来帮助我检测代码中的问题(并教我最佳实践)。现有代码中有一些地方是编码者创建了无法访问的代码。例如，他们添加了'&& 0‘作为一种懒惰的方式来注释掉一些代码分支： unreachable

浏览 3提问于2014-04-28得票数 8

2回答

利用Cuda并行实现大数组中大相邻子序列和的计算

、、、

我有一个由1000个元素组成的大数组，我想用CUDA计算这个大数组中大小为100的大型连续子序列的和。这里是一个小尺寸的说明性例子。数组的大小为20，序列的大小为5。tab = [80,12,14,5,70,9,26,30,8,12,16,15,60,12,38,32,17,67,19,11]S1= 80+12+14+5+70S3= 14+5+70+

浏览 1提问于2017-02-14得票数 0

回答已采纳

4回答

Python:重写在GPU上运行的循环numpy数学函数

、、、、

我在想，也许有人能帮我重写这个函数，不管你看上去像日志一样，因为我在结尾给出了同样的结果。我试图从@jit中使用numba，但由于某种原因，它实际上比往常运行代码要慢得多。有了一个巨大的样本大小，目标是大大减少执行时间，所以我相信GPU是最快的方法。我来解释一下到底发生了什么。在其他三个答案中，有两个是基于CPU的解决方案，一个是tensorflow-GPU尝试。保罗·潘泽( Panzer )的Tensorflow-GPU<

浏览 15提问于2017-01-31得票数 25

回答已采纳

2回答

是否可以保证WaveFront (OpenCL)中的所有线程总是同步的？

、、、、

翘曲一次执行一条公共指令，所以当一个翘曲的所有32个线程都同意它们的执行路径时，就能实现完全的效率。如果翘曲的线程通过依赖于数据的条件分支发散，则翘曲会依次执行所采取的每个分支路径，禁用不在该路径上的线程，并且当所有路径完成时，这些线程将收敛到相同的执行路径。分支发散只在翘曲中发生；不同的翘曲独立执行，不管它们是执行公共

浏览 1提问于2017-02-15得票数 2

回答已采纳

2回答

部分共享数据结构公共lisp

、

假设我想有两个列表，(setq x '(1 2 3))和(setq y (list 1 (cadr x) 3)，但是我希望(cadr y)实际上指向(cadr x)，这样在(setf (cadr x) 'a)之后，(cadr y)会给出A而不是2。有办法吗？

浏览 3提问于2017-01-24得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

哪一个TensorFlow和CUDA版本组合是兼容的？

深入分析CPU和GPU之间的差异

Tensorflow在被Ray worker调用时无法检测GPU

_get_hyper和_set_hyper在TensorFlow优化器中是什么？

Keras (tensorflow)找到GPU，但仅在带有Cuda 10.1的cpu上运行

如何使用CUDA通过密集向量积加速稀疏矩阵，目前是通过scipy.sparse.csc_matrix.dot实现的？

哪个有更好的表现，为什么？

GLSL和GPU片段着色器执行中的求和面积表

使用(一些)全局变量而不是静态函数变量来初始化值？

Windows上的TensorFlow：“无法打开CUDA库cudnn64_5.dll”

Tensorflow-gpu错误: InvalidArgumentError:无法为操作“MatMul”分配设备

子类GRUCell调用方法中的tf.keras.Model循环

合同以外的输入值是否应该进行单元测试？

MATLAB:是否有可能重载本机构造(单元、结构等)上的运算符？

如何在总是计算为false的Perl条件中检测不可达的代码？

利用Cuda并行实现大数组中大相邻子序列和的计算

Python:重写在GPU上运行的循环numpy数学函数

是否可以保证WaveFront (OpenCL)中的所有线程总是同步的？

部分共享数据结构公共lisp

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐