nvidia cuda访问gpu共享内存

NVIDIA CUDA是一种并行计算平台和编程模型，用于利用NVIDIA GPU的强大计算能力。CUDA允许开发人员使用C/C++、Fortran等编程语言来编写并行计算程序，以在GPU上执行高性能计算任务。

访问GPU共享内存是CUDA编程中的一个重要概念。共享内存是位于GPU上的一块高速缓存区域，用于在同一个线程块内的线程之间共享数据。相比于全局内存，共享内存的访问速度更快，因此可以用于提高并行计算的性能。

在CUDA编程中，可以使用特殊的关键字__shared__来声明共享内存变量。共享内存的大小是有限的，通常是每个线程块的大小的限制。线程块内的线程可以通过共享内存来交换数据，以减少对全局内存的访问。

访问GPU共享内存可以提高并行计算的效率，特别是在需要进行数据交换和协同计算的情况下。一些常见的应用场景包括图像处理、矩阵运算、模拟和仿真等。

腾讯云提供了适用于GPU计算的云服务器实例，例如GPU加速型云服务器和GPU共享型云服务器。您可以根据自己的需求选择适合的实例类型，并使用CUDA进行GPU计算。具体的产品介绍和相关链接地址可以在腾讯云官方网站上找到。

请注意，本回答中没有提及其他云计算品牌商，如有需要，您可以自行搜索相关信息。

nvidia cuda访问gpu共享内存

、、

我正在尝试使用cuda分配共享gpu内存(与共享内存技术无关)。内存在英特尔和nvidia gpu之间共享。为了分配内存，我使用cudaMallocManaged，最大分配大小是2 2GB (对于cudaMalloc也是如此)，所以专用内存的大小。 ? 有没有办法从主机上分配gpu共享内存或RAM，然后在内核中使用？

浏览 111提问于2019-12-13得票数 0

回答已采纳

1回答

我有一个关于CUDA Fermi's architecture的问题:我在某个地方读到过，在Fermi's architecture中，全局内存的访问速度与共享内存一样快，因为它们现在使用统一寻址。因此，我真的可以访问全局内存上的数据而不会有(大)延迟(不像“预费米”GPU)？对我来说，知道这一点非常重要，因为我正在为Nvidia Tesla GPU编程，但没有它(它在大学的实验室里，我在夏天不能访问它……)

浏览 3提问于2012-08-12得票数 0

3回答

解决推力/CUDA警告“无法判断指针指向...”

、、

我正在尝试使用推力/CUDA 4.0构建一个简单的应用程序，并收到许多警告“警告:假设全局内存空间，无法分辨指针指向什么” 其他人看到了吗?我该如何禁用它们或修复我的代码？谢谢, Ade 这是我的代码。 Hello.h class DECLSPECIFIER Hello { private: thrust::device_vector<unsigned long> m_device_data; public: Hello(const thrust::host_vector<unsigned long>& data); unsi

浏览 1提问于2011-03-07得票数 10

回答已采纳

2回答

GKE GPU分时驱动程序功能

、、、、

我在Google引擎上运行nvidia/cuda:11.8.0-base-ubuntu20.04，使用T4 GPU上的GPU分时检查我得到的计算和实用程序的驱动程序能力。我希望也能得到图形和视频。这是对GKE分时的限制吗？

浏览 39提问于2022-10-19得票数 0

1回答

我能在代码共享内存中使用nVidia Quadro KxxxxM (MXM)移动GPU吗？

、、、、

正如我所看到的，在中，nVidia Quadro KXXXXM - Mobile (MXM)中有。但是，如果我想在CUDA C/C++上为这些卡编写，我可以在代码共享内存中使用吗?如果可以的话，如果可以的话，会发生什么情况呢?我将使用全局GPU-RAM吗？

浏览 7提问于2013-11-02得票数 1

回答已采纳

3回答

为什么PyTorch找不到我的NVDIA驱动程序来支持数据自动化系统？

、、

我在机器中添加了一个GeForce GTX1080Ti(运行Ubuntu18.04和使用Python3.7运行Anaconda )，以便在使用PyTorch时使用GPU。这两张卡片的识别都是正确的： $ lspci | grep VGA 03:00.0 VGA compatible controller: NVIDIA Corporation GF119 [NVS 310] (reva1) 04:00.0 VGA compatible controller: NVIDIA Corporation GP102 [GeForce GTX 1080 Ti] (rev a1) NVS 310处理我的2

浏览 5提问于2019-01-19得票数 13

1回答

在新的CUDA6中，可以通过简单的指针从CPU内核访问GPU吗？

、、、

现在，如果我使用这段代码尝试通过在GeForce GTX460SE (CC2.1)中使用CUDA5.5从CPU内核访问GPU，那么我将得到一个异常“访问冲突”： #include "cuda_runtime.h" #include "device_launch_parameters.h" #include <iostream> int main() { unsigned char* gpu_ptr = NULL; cudaMalloc((void **)&gpu_ptr, 1024*1024); *gpu_ptr

浏览 1提问于2013-11-19得票数 1

回答已采纳

1回答

使用Nvidia GPU节点在Kubernetes上运行一个例子

、、

我正在尝试用Nvidia GPU节点/奴隶来设置Kubernetes。我遵循了的指南，并且能够让节点加入集群。我尝试了下面的kubeadm示例pod： apiVersion: v1 kind: Pod metadata: name: gpu-pod spec: containers: - name: cuda-container image: nvidia/cuda:9.0-base command: ["sleep"] args: ["100000"] extendedResourceReques

浏览 3提问于2018-08-07得票数 1

回答已采纳

1回答

当在图形处理器上使用X11时，XShmGetImage是否会为您提供主机/设备内存？

、、、、

如果你在图形处理器上运行X11，如下所示： Fri Aug 2 23:52:39 2019 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 430.30 Driver Version: 430.30 CUDA Version: 10.2 | |-------------------------------+----------------------+----------------------+ | GPU Name

浏览 2提问于2019-08-03得票数 1

1回答

在使用HIP C++的AMD上使用“What”操作的要求是什么？

、、、、

有AMD HIP C++，非常类似于CUDA C++。此外，AMD还创建了Hipify，将CUDA C++转换为HIP C++ (便携式C++代码)，该代码可以在nVidia GPU和AMD：上执行。在shfl GPU：上使用nVidia操作是有要求的对nvidia的要求使用此应用程序时，请确保您有一个3.0或更高版本的设备，以便使用warp操作，并在Makefile中添加-gencode arch=compute=30、code=sm_30 nvcc标志。还注意到HIP支持shfl的64波形(翘曲尺寸)在AMD：上。此外，HIP还定义了可移植的查询

浏览 6提问于2017-02-26得票数 1

回答已采纳

1回答

nVIDIA CUDA驱动程序的作用到底是什么？

、、

Nvidia CUDA驱动程序的具体功能是什么？从使用CUDA的角度来看。驱动程序传递内核代码，以及执行配置(线程数、块数)...还有什么呢？我看到一些帖子，说司机应该知道可用的短信数量。但这不是没有必要的吗？一旦内核被传递到GPU，GPU调度器只需要将工作分散到可用的SMs...

浏览 2提问于2012-03-19得票数 2

回答已采纳

1回答

GPU-带纹理的CUDA中的性能

、

我有一个关于NVIDIA GPU性能的问题。我有一个实现，我在两个数组之间进行插值。使用倾斜到线性内存的纹理比使用CUDA数组更快。目前，我只在一个GPU上试用了它。每个GPU上都是这样吗?或者会有差异吗？我在笔记本电脑上使用GPU。桌面GPU是否更快？因为目前我只获得了2-3的加速。我可能看起来像一个愚蠢的问题，但我会感谢一个在许多GPU上处理纹理的人的回答。我想知道使用CUDA-Arrays (它应该有一些缓存优化...)速度更慢。我正在NVIDIA Quadro 2000m上工作，我正在将它与I7-2860QM @ 2,50GHZ (实现)进行比较。这是一场公平的竞赛吗？

浏览 1提问于2012-11-21得票数 3

回答已采纳

1回答

nvidia -没有nvidia专用X服务器的设置

、、、

我有一台机器，我使用的车载视频卡(非Nvidia )驱动显示器，我有2个Nvidia GPU的安装和功能与最新的驱动程序。我的CUDA GPU应用程序工作，但我想调整一些设置。据我理解，除非nvidia GPU驱动显示器(真实的还是虚拟的)，否则无法使用nvidia-设置，这是正确的吗？我真的在寻找一个解决方案，以调整GPU设置，而不必有一个Nvidia GPU驱动显示器，或X。我只是不希望CUDA资源被用来驱动显示器。也许在Xvfb上运行nvidia设置或者类似的设置是一种选择？

浏览 0提问于2017-08-22得票数 2

1回答

您的内核可能是在没有NUMA支持的情况下构建的

、、

我有Jetson TX2，Python2.7，Tensorflow 1.5，CUDA 9.0 Tensorflow似乎工作正常，但每次我运行程序时，都会收到这样的警告： with tf.Session() as sess: print (sess.run(y,feed_dict)) ... 2018-08-07 18:07:53.200320: E tensorflow/stream_executor/cuda/cuda_gpu_executor.cc:881] could not open file to read NUMA node: /sys/bus/pci/devices/0000:0

浏览 15提问于2018-08-08得票数 2

回答已采纳

1回答

nvidia-smi命令未在DJI流形2G NVIDIA Jetson TX2上找到

、、

在通过终端运行nvidia-smi时，我会遇到nvidia-smi command not found，但是我知道jetpack 3.3 ( nvidia驱动程序)已经安装好了。是否有人遇到过类似的问题与Nvidia jetson tx2？ System specs: DJI Manifold 2G (Nvidia Jetson TX2) Jetpack 3.3.0 ARMv8 Processor rev 3 (v8l) × 4 ARMv8 Processor rev 0 (v8l) × 2 NVIDIA Tegra X2 (nvgpu)/integrated 8GB ram, Ubuntu

浏览 11提问于2021-12-09得票数 0

回答已采纳

1回答

多个GPU和多个可执行文件

假设我有4个GPU，并且希望并行运行50个CUDA程序。我的问题是: NVIDIA驱动程序是否足够聪明，可以在不同的GPU上运行50个CUDA程序，还是必须为每个程序设置CUDA设备？谢谢

浏览 12提问于2014-01-06得票数 2

回答已采纳

1回答

在多个GPU系统上分割数组并在不同的GPU之间传输数据。

、

我正在使用CUDA的双重GPU系统使用NVIDIA GTX 590卡，我有一个数组分区根据下图。如果我要使用CudaSetDevice()将子数组拆分到GPU上，它们会共享相同的全局内存吗？第一个设备可以访问第二个设备上的更新数据吗?如果可以，如何访问？谢谢。

浏览 0提问于2013-07-24得票数 0

回答已采纳

1回答

CUDA过程寿命

、、、

看来我对数据自动化系统没有什么必要的理解。我正在使用一个C++图形用户界面应用程序在一个双GPU卡上启动一些内核。启动主机进程时，nvidia-smi没有列出任何进程。这是预期的，因为主机进程一直等到我单击按钮后才使用CUDA并启动内核。如果我按下按钮，这两个内核在两个GPU上运行良好，退出并返回预期的结果。然后，主机进程由nvidia-smi列出两次，每个GPU一次。这两个进程在nvidia-smi中都是可见的，直到我退出主机进程为止。我有点困惑，因为没有cudaOpen()或cudaClose()函数(或类似的函数对)。哪个CUDA调用会导致一个进程被nvidia-smi列出？哪个CU

浏览 17提问于2022-02-25得票数 -2

回答已采纳

5回答

在亚马逊g2上的Ubuntu14.04上使用图形处理器的Theano

、、、、

我很难让Theano在我的机器上使用GPU。当我运行: /usr/local/lib/python2.7/dist-packages/theano/misc$ THEANO_FLAGS=floatX=float32，device=gpu python check_blas.py WARNING (theano.sandbox.cuda)：已安装CUDA，但设备gpu不可用(错误:无法获取可用的gpu数量:未检测到支持CUDA的设备) 我还检查了NVIDIA驱动程序是否安装了: lspci -vnn | grep -i VGA -A 12 with result:内核驱动程序正在使用: nvi

浏览 2提问于2014-07-10得票数 4

2回答

CUDA与Theano的集成

、、、

我正在使用西亚诺，一个深度学习基准，在一个新安装的Ubuntu 16.04机器上工作。Theano可以使用GPU加速来加速计算。我有一个NVIDIA K2200M视频卡，它具有CUDA功能，并且安装正确，如nvidia-smi命令所示： +------------------------------------------------------+ | NVIDIA-SMI 361.42 Driver Version: 361.42 | |--------------------

浏览 0提问于2016-04-24得票数 1

回答已采纳

1回答

cuda /nvidia- sagemaker上的驱动程序与自定义容器不匹配

、

我有一个自定义容器(从nvidia/cuda:9.0-runtime派生)来在sagemaker上运行训练。但在启动时，我得到了错误CUDA driver version is insufficient for CUDA runtime version at torch/csrc/cuda/Module.cpp:32，它显然想告诉我的cuda版本不支持图形驱动程序(...how最好同时公开两个版本号和错误消息...)，但我不知道如何找出容器中安装了什么显示驱动程序。我能找到的就是上面写着sagemaker内置了nvidia-docker。我试图在错误发生前触发nvidia-smi，但容器中不知

浏览 0提问于2018-06-14得票数 1

3回答

用于cuda开发的GTX 295与其他nvidia显卡

、

最适合cuda开发的nvidia显卡是什么？单个GTX 295有2个GPU，是否可以有2个GTX 295并在我的cuda代码中使用4个GPU？得到两张480卡比得到两张295卡更好吗？费米牌会比两张牌都好吗？

浏览 0提问于2010-09-22得票数 3

回答已采纳

1回答

最近NVIDIA GPU的合并宽度是多少？

、、、

在中，作者说，当时CUDA在NVIDIA上的合并宽度是16 (第3页，最后一段)。这篇论文很老了，我找不到新设备的信息。最近NVIDIA GPU的合并宽度是多少？

浏览 1提问于2016-02-10得票数 1

回答已采纳

1回答

Tensorflow无法检测到GPU

、、

我一直在努力让tf/keras与CUDA一起工作。我相信CUDA和Nvidia驱动程序安装在我的Linux/ubuntu盒上是正确的，因为，，我的茱莉亚可以使用GPU，绝对没有问题。如果tf/keras能像朱莉娅那样对GPU有如此好的配置，那就太好了。。当我运行nvidia-smi时，我得到了 NVIDIA-SMI 470.103.01驱动程序版本: 470.103.01 CUDA版本: 11.4 \ GPU名称持久性-M\x总线-Id Disp.A易失性\ Uncorr。ECC _x 我为cuda安装了python工具，包括库达图尔基特但是当我运行python并要求告诉我我得到的GP

浏览 7提问于2022-03-14得票数 0

1回答

C++数据自动化系统Gridsize含义的澄清

、、、、

我是CUDA程序的新手。我目前正在对大量的大数据样本进行蒙特卡罗模拟。我试图动态最大化和计算提交给GPU的块数。我的问题是，我不清楚如何计算最大数量的块，我可以提交我的GPU在同一时间。下面是我的GPU在查询它时的输出： ----------------------------------------------- CUDA Device #: 0 Name: NVIDIA GeForce GTX 670 Revision number: 3.0 Warp size:

浏览 5提问于2022-08-07得票数 0

回答已采纳

6回答

如何选择要在哪个GPU上运行作业？

、

在多GPU计算机中，如何指定一个CUDA作业应该在哪个GPU上运行？例如，在安装CUDA时，我选择安装NVIDIA_CUDA-<#.#>_Samples，然后运行几个nbody模拟实例，但它们都运行在一个GPU 0上；GPU 1完全空闲(使用watch -n 1 nvidia-dmi监视)。使用CUDA_VISIBLE_DEVICES检查 echo $CUDA_VISIBLE_DEVICES 我发现这个没被设定好。我试着用 CUDA_VISIBLE_DEVICES=1 然后再次运行nbody，但它也转到GPU 0。我看了相关的问题，，但是deviceQuery命令不在CUDA8

浏览 11提问于2016-09-22得票数 122

回答已采纳

1回答

如何通过删除张量来释放gpu内存？

、

假设我创建了一个张量，并将它放在GPU上，以后不需要它，并且希望释放分配给它的GPU内存；我该如何做呢？ import torch a=torch.randn(3,4).cuda() # nvidia-smi shows that some mem has been allocated. # do something # a does not exist and nvidia-smi shows that mem has been freed. 我试过： del a del a; torch.cuda.empty_cache() 但它们都不管用。

浏览 0提问于2019-04-22得票数 6

回答已采纳

2回答

CUDA表面存储器的峰值带宽？

、、、

表面存储器是CUDA中纹理缓存的唯一模拟. 我在学术文献中找到了NVIDIA ，用于从全球内存和共享内存中读取。然而，我发现有关CUDA存储设备的写吞吐量的信息较少。特别是，我对费米和开普勒GPU上CUDA表面存储器的带宽(如果已知的话也是延迟)感兴趣。这上面有标杆号码吗？如果不是，那么我如何实现一个基准来测量写入表面内存的带宽呢？

浏览 5提问于2013-01-17得票数 1

1回答

RuntimeError: CUDA。有足够的GPU内存

火炬错误： RuntimeError: CUDA out of memory. Tried to allocate 392.00 MiB (GPU 0; 10.73 GiB total capacity; 9.47 GiB already allocated; 347.56 MiB free; 9.51 GiB reserved in total by PyTorch) 我通过nvidia-smi检查了GPU资源，显示没有其他正在运行的进程和内存-使用情况: 10/10989MiB。 +------------------------------------------------------

浏览 1提问于2021-04-24得票数 1

1回答

如何使用NVIDIA K80？

本机设有4台NVIDIA K80s，输出的nvidia-smi为4卡的信息。他们的GPU ID是0,1,2,3。每个K80都有两种类型的GPU内存：FB和BAR1，两者都有12 Gb。但是CUDA程序总是使用FB内存，而BAR1内存则是空闲的。当CUDA程序在每个卡中分配超过12 Gb的GPU内存时，将发生Out of memory错误，但仍未使用BAR1内存。如何在此设置中正确使用BAR1内存？更新了 nvidia-smi的部分输出是 Compute Mode: < Default (multiple host threads can use ::cu

浏览 15提问于2016-01-25得票数 1

回答已采纳

1回答

对于GPU上的非原子写入的弱保证？

、、、

OpenCL和CUDA已经包括了几年的原子操作(虽然显然不是每个CUDA或OpenCL设备都支持这些操作)。但是-我的问题是，由于非原子的写作，“与种族一起生活”的可能性。假设一个网格中的多个线程都写入全局内存中的相同位置。我们是否保证，当内核执行结束时，其中一个写操作的结果将出现在该位置，而不是一些垃圾？这个问题的相关参数(选择任意组合，编辑，除了已经得到答案的nVIDIA+CUDA )：内存空间:仅限于全局内存；此问题不涉及本地/共享/私有内存。对齐:在单个内存中写入宽度(例如，nVIDIA GPU上的128位) GPU制造商: AMD / nVIDIA 编程框架:

浏览 0提问于2016-07-02得票数 5

6回答

tensorflow中的CUDA_ERROR_OUT_OF_MEMORY

当我开始训练一些神经网络时，它满足了CUDA_ERROR_OUT_OF_MEMORY，但训练可以毫无错误地进行。因为我想在真正需要的时候使用gpu内存，所以我设置了如下的gpu_options.allow_growth = True.The日志： I tensorflow/stream_executor/dso_loader.cc:111] successfully opened CUDA library libcublas.so locally I tensorflow/stream_executor/dso_loader.cc:111] successfully opened CUDA l

浏览 5提问于2016-09-13得票数 45

1回答

如何使一个全新的ubuntu20.04VM中的GPU可用？

、、、、

我一整天都在尝试让这个(v100) GPU在一个新的ubuntu上工作。我试着安装驱动程序，重新启动，以及清除/卸载与nvidia相关的所有内容，但这些东西似乎都不起作用。特别是，我具体地运行了以下内容： apt update; apt install build-essential; sudo add-apt-repository ppa:graphics-drivers sudo apt install ubuntu-drivers-common ubuntu-drivers devices sudo apt-get install nvidia-driver-460 sudo reb

浏览 0提问于2021-07-19得票数 1

1回答

我可以使用一个单一的地址空间的GPU，CPU和FPGA看起来像CUDA UVA？

、、、、

如果我正在使用CUDA开发，那么我就有机会使用UVA (统一虚拟寻址)--所有GPU的CPU-RAM和GPU的一个地址空间。以前，这是不可能的，它只出现在版本CUDA 4.0。据我所知，它是由nVidia数据自动化系统驱动程序提供的。但是如果我想在一台由PCI 2.0 16 x连接的计算机上使用GPU和FPGA，并且也为他们使用一个地址空间。在FPGA中是否有类似于nVidia UVA的可能性，我需要使用什么FPGA "UVA"，它们也不会干扰FPGA "UVA“对nVidia UVA？怎么做这样的事？

浏览 12提问于2013-09-03得票数 4

回答已采纳

2回答

cudaHostRegister是否等同于mlock()系统调用？

、、、

与非锁定内存相比，固定内存或页锁定内存传输到GPU的速度更快。CUDA提供cudaHostAlloc和cudaHostRegister调用来分配或注册页锁定内存。然后，Nvidia驱动程序检查内存传输时主机内存是否被锁定，并根据复制代码路径发出相应的命令。是否有可能使用系统调用mlock()实现与cudaHostRegister完全相同的效果(关于传输速度)来对内存进行分页锁定？或者相应的CUDA调用是否更新驱动程序查询的内部数据库？

浏览 2提问于2012-05-18得票数 3

回答已采纳

2回答

开始使用Matlab中的CUDA

、

嘿，我需要开始在Matlab中使用Cuda。因为我需要比matlab提供的函数更多的函数，所以我需要编写自己的c++代码，例如，我想在1..ngpu处理器上运行我的程序，并比较结果以计算加速比，这是Matlab本身不支持的(因为Matlab总是优化自己以使用所有处理器)。现在我想知道怎样才是最好的开始。我已经读了很多论文，但我仍然想知道，例如，这些文件都是关于什么的： .cu .cubin .ptx .mex 那么我该走哪条路呢？将我的代码编写到一个.cu文件中，然后编译它(使用哪个工具？我的电脑是：带有GTX460的Q9550、Win7 x64、Matlab R2010b x64、Vi

浏览 0提问于2011-04-20得票数 1

回答已采纳

1回答

使用GPU时opencv中的像素访问(CUDA)

、、、、

如果我想使用GPU，如何在opencv中访问图像的像素？有没有GPU专用的东西？例如，访问速度等等？通过opencv的接口可以比通过普通的CUDA更简单吗？

浏览 0提问于2012-02-01得票数 1

回答已采纳

2回答

确定linux下GPU内存供应商的名称

、

能否确定linux中专用GPU中使用的内存的供应商名称？在Windows下，有一个名为GPU的工具显示这个值，因此在linux下似乎没有显示该值的工具. 我使用的GPU是使用Cuda8和Nvidia专有驱动程序的Geforce GTX 1060 干杯

浏览 0提问于2017-08-11得票数 1

1回答

qmake中引号的问题

、

我对qt创建者的qmake有个问题。这是我的.pro文件中搞乱的部分： CUDA_DIR = "C:/Program Files/NVIDIA GPU Computing Toolkit/CUDA/v7.0" SYSTEM_NAME = Win32 # library directories QMAKE_LIBDIR += $$CUDA_DIR/lib/$$SYSTEM_NAME\ # Add the necessary libraries CUDA_LIBS= -lcuda -lcudart LIBS += $$CUDA_LIBS 以下是我希望得到的东西： "C:

浏览 2提问于2015-11-29得票数 2

2回答

window-7 x64下脱机环境下运行Tensorflow-GPU的问题

、、、

我正在尝试在离线环境(windows 64)中使用tensorflow-gpu库。我的python版本为3.6，为64位，我使用的是Anaconda3解释器(5.2.0版本)。库达9.2和cuddn 7.1.4 (从下载) 我下载了tensorflow-1.2.1-py36_0.tar.bz2和tensorflow-gpu-1.1.0-np112py36_0.tar.bz2，并使用Conda安装安装了这些文件。我看到库出现在“C：\ProgramData\Anaconda3 3\Lib\site-packages”下面，但是尽管tensorflow (cpu下)运行良好，但当尝试运行tenso

浏览 0提问于2018-09-12得票数 0

1回答

tensorflow docker gpu镜像检测不到我的GPU

、、、

使用以下命令运行最新的docker： docker run -it -p 8888:8888 tensorflow/tensorflow:latest-gpu-jupyter jupyter notebook --notebook-dir=/tf --ip 0.0.0.0 --no-browser --allow-root --NotebookApp.allow_origin='https://colab.research.google.com' 代码： import tensorflow as tf print("Num GPUs Available: ",

浏览 48提问于2020-07-28得票数 3

回答已采纳

1回答

为什么我不能运行命令“nvcc-版本”在码头-CUDA容器？

、、、、

我的操作系统是Ubuntu18.04，我已经安装了nvidia驱动程序和nvidia-docker，但是无法检测到CUDA。 $ docker run -it --gpus all nvidia/cuda:10.0-cudnn7-runtime-ubuntu18.04 /bin/bash root@7c0be9bfaeec:/# nvcc --version bash: nvcc: command not found 此外，我无法在码头集装箱中检测到CUDNN： root@694cefcad33a:/# cat /usr/local/cuda/include/cudnn.h | grep CU

浏览 0提问于2019-12-19得票数 5

2回答

GPU多处理器在内核块执行之间的共享内存会发生什么？

、

假设我有一个包含大量块的CUDA内核，并且假设在同一个对称多处理器(即所有翘曲的共享内存区域相同的单元)上，某个块被排在另一个块之后。目前，NVIDIA并没有在API或每个GPU文档中指定执行之间的共享内存发生了什么。但是，在实践中，对于块的共享内存内容，下列哪一项保持不变？最后一个预定的块离开它的状态是一样的。是空白的。里面有不可预见的垃圾。为了缩小可能出现的情况的变化范围，请具体参考每个块使用最大可能的共享内存--开普勒GPU上的48 KB内存的情况。

浏览 8提问于2013-12-13得票数 3

回答已采纳

1回答

cuda在带r的torch中不可用

、、

我在Python环境中使用过深度学习。另外，我可以在r中使用带gpu的keras，但是torch(r包中的其他深度学习框架)不能使用gpu。当我在谷歌上搜索时，CUDA版本可能会出问题。所以我下载了10.2v和11.2v的最新版本。然后，它进入path。 Sys.getenv() CUDA 10.2 CUDA_PATH C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2 CUDA_PATH_V10

浏览 0提问于2021-03-28得票数 0

2回答

使用cupy时内存不足

、

当我使用cupy来处理一些大数组时，出现了内存错误，但是当我检查nvidia-smi来查看内存使用情况时，它没有达到我的GPU内存的极限，我使用的是nvidia geforce RTX 2060，GPU内存是6GB，下面是我的代码： import cupy as cp mempool = cp.get_default_memory_pool() print(mempool.used_bytes()) # 0 print(mempool.total_bytes()) # 0 a = cp.random.randint(0, 256, (109

浏览 0提问于2019-10-28得票数 1

回答已采纳

1回答

使用Cuda 10.2生成OpenCV 2.4xx时出错

、

我正在尝试用库达-10.2构建OpenCV 2.4，它安装在上。我跟踪了的博客帖子，以改变文件，使opencv能够找到所有的库达库。我正在运行以下命令来生成cmake缓存： cmake -DCMAKE_INSTALL_PREFIX=~/lib/opencv_2.4/installed -DCMAKE_BUILD_TYPE="Release" -DWITH_CUDA=ON -DCUDA_GENERATION=Volta -D OPENCV_DNN_CUDA=ON -DCUDA_ARCH_BIN=7.5 -DCUDA_HOST_COMPILER=/usr/bin/gcc-8 -D

浏览 7提问于2021-01-08得票数 0

回答已采纳

1回答

如何在Ubuntu14.04 x64上安装Theano，并将其配置为使用GPU？

、

我试着遵循上的说明，但它不起作用:每当我使用GPU运行Theano脚本时，它都会给出错误消息：安装了CUDA，但设备gpu不可用(错误:无法获得可用gpu的数量:没有检测到具有CUDA功能的设备) 更具体地说，按照链接网页中的说明，我执行了以下步骤： # Install Theano sudo apt-get install python-numpy python-scipy python-dev python-pip python-nose g++ libopenblas-dev git sudo pip install Theano # Install Nvidia driv

浏览 5提问于2015-11-16得票数 4

回答已采纳

1回答

如何解决""RuntimeError: CUDA out of memory."？有办法释放更多的内存吗？

、、、

在本例中，我在VM上使用jupyter notebook来训练一些CNN模型。虚拟机具有16v CPU和60 VM内存。为了获得更好的性能，我刚刚安装了一台NVIDIA TESLA P4。但是它总是会给出像"RuntimeError: CUDA out of memory. Tried to allocate 196.00 MiB (GPU 0; 7.43 GiB total capacity; 2.20 GiB already allocated; 180.44 MiB free; 226.01 MiB cached)"这样的错误为什么会发生这种情况？系统都是干净的。我想

浏览 114提问于2019-12-11得票数 3

3回答

错误加载tensorflow -找不到"cudart64_80.dll“

、

我正在尝试导入tensorflow (用GPU)并继续获取以下错误： ImportError:找不到cudart64 64_80.dll。TensorFlow要求将此DLL安装在%PATH%环境变量中指定的目录中。设置： NVIDIA GTX 1080 CUDA开发工具v8.0 cuDNN 6.0 tensorflow-gpu 1.4 环境变量： CUDA_HOME: C:\Program \NVIDIA计算工具包\CUDA\v8.0 CUDA_PATH: C:\Program \NVIDIA计算工具包\CUDA\v8.0 CUDA_PATH_V8

浏览 4提问于2017-12-18得票数 5

回答已采纳

1回答

CUDA驱动程序安装，错误：“无法安装显示驱动程序，需要根访问。”

、、、

我试图在本指令之后安装CUDA驱动程序(尤其是Tensorflow的GPU版本)。我还没有完成Nvidia驱动程序的安装，因为我遇到了跟随误差，但是nvidia-smi显示了相应的GPU指标，所以我假设已经安装了Nvidia驱动程序。现在，当我试图安装CUDA驱动程序时，它会失败，并发出以下消息： Unable to install the display driver, root access is needed. Skipping any remaining installation actions. 我输入的命令如下所示： sudo chmod +x cuda_7.5.18_linux

浏览 0提问于2017-05-23得票数 0

回答已采纳