多gpu编程 - 腾讯云开发者社区

、、、

我正在使用cuda编程来进行有效和快速的计算。在研究过程中，我发现多gpu和gpu集群是进一步有效计算的另一种手段，但我把这两个术语搞混了。在编程cuda方面，这两者之间的实际区别是什么？

浏览 1提问于2014-04-03得票数 0

1回答

是否可以在多个gpus上运行cuda内核

、、、

我想知道的是，如果我有两个GPU卡(相同的)能够运行cuda，我的内核可以跨越这两个卡吗？或者它绑定在一张或另一张卡上？也就是说，cuda提供了整个可用的gpu核心集，或者只是运行它的卡上的那些核心。如果是这样的话，为了实现它，我需要知道什么特别的东西吗?除了cuda sdk之外，还有什么值得了解的例子吗？

浏览 1提问于2010-12-03得票数 7

回答已采纳

1回答

CUDA中的稀疏Cholesky分解

、、、

随着CUDA编程模型的成熟，我想知道是否有人知道在NVIDIA GPU上实现稀疏Cholesky分解的可用的研究代码或开源库。1 Christen等人，2007年使用NVIDIA CUDA技术平台的通用稀疏矩阵构建块，3 Yu等，2011年，用于非对称多额面方法的CPU-GPU混合方法， 4 George et al.，2011，《GPU上稀疏SPD矩阵的

浏览 13提问于2013-01-02得票数 1

回答已采纳

1回答

Arrayfire python是否支持多GPU编程

、、

我正在尝试使用GPU ()进行多arrayFire编程。但是，当我尝试将它与并发期货()库连接时，我遇到了同步问题。有谁有关于如何使用arrayfire-python在多个GPU上并行处理的建议吗？

浏览 7提问于2016-11-08得票数 2

1回答

OpenGL多GPU支持

、、

最新的OpenGL (4.5) API支持多GPU体系结构吗？如果我有两个相同的显卡(例如，两个Nvidia GeForce卡)，我如何正确地编程OpenGL API以从我有两个卡片这一事实中获得好处？如何用最小的努力将OpenGL程序从单个GPU版本转换为多GPU版本？

浏览 5提问于2017-05-05得票数 10

回答已采纳

1回答

使用多个CUDA GPU

我正在使用NVIDIA网格K2进行CUDA编程。它有两个GPU，每个有1536个核心。是否可以在单个或多个内核调用中同时使用这两个GPU？

浏览 2提问于2016-02-07得票数 6

回答已采纳

2回答

我正在尝试使用TensorFlow对象检测应用编程接口执行多GPU训练。我在我的NVIDIA-SMI中看到的是，实际上只有1个GPU被使用。提供的其他3个GPU加载了GPU进程，但内存使用率为300MB，利用率始终为0% 我使用在COCO上预先训练的基于固态硬盘MobileNetV1的网络，然后用我的自定义数据集对其进行训练。我希望当我为Tensorflow提供更多的GPU时，框架实际上会使用它们来加速训练。

浏览 49提问于2019-10-09得票数 3

1回答

使用多(CPU)线程的多GPU编程

、

是否可以启动多个CPU线程，使一个线程管理一个GPU?如果可能，我应该在CPU端使用什么线程库？OpenMP?Pthread？

浏览 1提问于2012-08-06得票数 1

回答已采纳

2回答

使用CUDA的多GPU编程策略

我计划使用CUDA 4.0在一个使用CUDA 4.0的多GPU节点上运行简单的内核(尚未决定，但我使用的是令人尴尬的并行内核)，方法如下所示。其目的是通过在多GPU环境下启动CUDA提供的不同策略的内核来描述节点。单个主机线程-多个设备(共享context)Single主机线程-单个设备上内核的并发执行(共享context)Multiple主机线程-(相等)多设备)(独立contexts)Single主机线程-在一个设备上的顺序内核执行多主机线程欢迎您对我所选择的测试类别和任何一般性建议

浏览 3提问于2011-07-01得票数 7

回答已采纳

2回答

多GPU* Cuda计算*

、、

我是多gpu编程的新手，我有一些关于多gpu计算的问题。例如，让我们以点积为例。我正在运行一个CPU线程，它创建了两个大的数组AN和BN。由于这些数组的大小，我需要将它们的点积计算分成两个GPU，都是特斯拉M2050(计算能力2.0)。问题是，我需要在由CPU线程控制的do循环中多次计算这些点积。每个点积都需要前一个点积的结果。我读到过创建两个不同的线程来分别控制两个不同的GPU(如cuda示例所述)，但我不知道如何在它们之间同步和交换数据。还有别的选择吗？我真的很感谢

浏览 2提问于2012-03-04得票数 5

回答已采纳

3回答

不同硬件的编程模型

、、、

我对不同类型硬件的不同编程模型感兴趣。我的问题是：如何编写程序以利用AMD/Intel芯片上

浏览 4提问于2011-11-25得票数 3

2回答

带2个视频卡的CUDA C编程

、、

我对CUDA编程非常陌生，正在阅读nvidia提供的“CUDA C编程指南”。() 在第25页中，它有下面的C代码，它执行矩阵乘法。你能告诉我怎样才能让这些代码在两台设备上运行吗？

浏览 1提问于2012-07-16得票数 7

回答已采纳

6回答

普通的编程任务转换成GPU有多好？

、

最近，我开始着手一个项目，以确定如何最好地利用现代显卡中可用的处理能力来进行通用编程。看来现场通用GPU编程(GPGPU)对科学应用有很大的偏向，数学比较重，这与GPU的计算模型非常吻合。这一切都很好，但大多数人并没有把所有的时间都花在运行仿真软件上，所以我们认为，为大众轻松构建支持GPU的软件创造一个共同的基础是可能的。这就引出了我想提出的问题:程序最常见的工作类型是什么？这不是一个要求工作非常好地转化为GPU编程，因为我们愿意接受适度的性能改进(总比没有好，对吗？

浏览 9提问于2008-09-04得票数 5

14回答

如何在tensorflow中获得当前可用的GPU？

、、

在集群环境中，每台机器都可能有0或1或更多的GPU，我希望在尽可能多的计算机上将TensorFlow图运行到GPU中。我发现在运行tf.Session()时，TensorFlow在日志消息中提供了有关GPU的信息，如下所示： I tensorflow/core/common_runtime/gpu/gpu_init.cc/gpu/gpu_device.cc:838] Creating Tens

浏览 23提问于2016-07-25得票数 227

回答已采纳

1回答

视频显示/解码/编码程序如何支持ARM GPU？

、、

例如，当我研究如何使用Mali 450GPU时，我发现了一些深奥且文档很少的C语言示例，例如将压缩帧发送到GPU并取回解码帧。是否有人必须在VLC中编写逻辑才能使用马里GPU公开的特定编码/解码API才能使用它，或者这些GPU是否遵循由所有GPU公开的某种一致的API，并且VLC/Kodi可以直接针对此系统API进行编程？我问这个问题的原因是，VLC和Kodi倾向于开箱即用地支持这些GPU，但像FFMPEG这样以支持尽可能多的编解码

浏览 8提问于2020-06-25得票数 0

1回答

为什么我在尝试本r300教程时得到“OpenGL FP:编译器错误：”？

、、

我从下载了教程，OpenGL 2.1端口。我按照说明编译它(使用C-make)。在我试图运行第8课的教程之前，一切都很好。当我试图从命令行运行可执行文件时，终端输出了以下消息：Compiling shader : StandardShading.vertexshader r300 FP: Compiler Error: Too many

浏览 2提问于2013-09-06得票数 1

回答已采纳

2回答

NUMA机上使用CUDA的多GPU编程

、、、

我目前将一个算法移植到两个GPU。硬件设置如下：我在主机上创建了两个线程来控制GPU。每个线程都绑定到一个NUMA，也就是说，两个线程都运行在一个CPU套接字上。如何确定GPU的数目，以便使用cudaSetDevice()选择直接连接的GPU？

浏览 4提问于2013-04-17得票数 3

回答已采纳

3回答

Caffe/pyCaffe:设置所有GPU

、、、、

是否可以为Caffe (特别是pyCaffe)设置所有GPU？类似于： caffe train -solver examples/mnist/lenet_solver.prototxt -gpu all

浏览 3提问于2015-11-15得票数 4

回答已采纳

1回答

训练时单GPU和多GPU设置的损失是否相同(Tensorflow)？

、、

我使用的批处理大小为10个图像上的一个单一的GPU培训。我同时使用相同的超参数在多GPU (3 GPU)设置上进行训练.对于多GPU，我使用的批处理大小为30张图像，即每GPU 10张图像.从理论上讲，在训练过程中，每个阶段的每一步损失值是否应该是单个GPU和多GPU训练过程中相同的值范围？就我而言，这不是我目前在训练中所看到的情况。多GPU的损失是我从单GPU

浏览 2提问于2019-01-31得票数 0

回答已采纳

1回答

以编程方式配置隐式多GPU呈现驱动程序设置

、、、

到2016年，游戏开发者有什么可以利用的隐式多GPU渲染技术？开发人员可以访问哪些工具，以编程方式检测和更改游戏中隐式多GPU呈现的状态？较小的开发人员有什么可以利用多个GPU的？有了所有这些，跨平台支持如何？

浏览 0提问于2016-05-07得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

多GPU vs GPU集群

是否可以在多个gpus上运行cuda内核

CUDA中的稀疏Cholesky分解

Arrayfire python是否支持多GPU编程

OpenGL多GPU支持

使用多个CUDA GPU

如何使用Tensorflow对象检测API启用多GPU训练

使用多(CPU)线程的多GPU编程

使用CUDA的多GPU编程策略

多GPU* Cuda计算*

不同硬件的编程模型

带2个视频卡的CUDA C编程

普通的编程任务转换成GPU有多好？

如何在tensorflow中获得当前可用的GPU？

视频显示/解码/编码程序如何支持ARM GPU？

为什么我在尝试本r300教程时得到“OpenGL FP:编译器错误：”？

NUMA机上使用CUDA的多GPU编程

Caffe/pyCaffe:设置所有GPU

训练时单GPU和多GPU设置的损失是否相同(Tensorflow)？

以编程方式配置隐式多GPU呈现驱动程序设置

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐