在具有多个GPU的单个节点上远程执行

、

我正在查阅关于在单个节点上远程运行hydra的文档。我正在寻找一些方法，在这些方法中，我可以运行本地计算机中的代码，并在GCP实例上运行它。有什么建议吗？

浏览 23提问于2021-08-04得票数 0

回答已采纳

1回答

TensorFlow matmul会在图形处理器上并行运行吗？(或任何GPU操作。)

我的问题是:在这里(matmul) (并在此基础上扩展:在所有类型的GPU上)，它真的会做到这一点吗？我认为要做到这一点，它需要创建多个CUDA流，对吧？它会自动做到这一点(以及如何做到)？或者它们将在GPU上按顺序执行？ (请注意，对于这个简单的示例，您还可以通过连接w1和w2重写代码，然后执行单个matmul，然后拆分。但这不是我的问题。)(相关的</

浏览 1提问于2018-07-24得票数 2

1回答

添加GPU卡会自动缩放tensorflow的使用吗？

、、、

假设我可以在我的带有tensorflow的GTX 1070卡上使用样本大小N、批处理大小M和网络深度L进行培训。现在，假设我想使用更大的样本2N和/或更深的网络2L进行训练，并摆脱内存错误。插入额外的GPU卡会自动解决这个问题(假设所有GPU卡的总内存量足以容纳批处理及其渐变)吗？还是说纯粹的坦索弗洛是不可能的？我读到，有比特币或以太矿商，他们可以用多个

浏览 4提问于2017-07-15得票数 2

回答已采纳

2回答

使用CUDA的多GPU编程策略

我需要一些关于我将要承担的项目的建议。我计划使用CUDA 4.0在一个使用CUDA 4.0的多GPU节点上运行简单的内核(尚未决定，但我使用的是令人尴尬的并行内核)，方法如下所示。其目的是通过在多GPU环境下启动CUDA提供的不同策略的内核来描述节点。单个主机线程-多个设备(共享context)Single主机

浏览 3提问于2011-07-01得票数 7

回答已采纳

2回答

MPI + GPU* :如何将这两种技术相结合*

、、

我的程序非常适合MPI。每个CPU执行自己的、特定的(复杂的)工作，生成一个double，然后我使用一个MPI_Reduce来乘以来自每个CPU的结果。我在谷歌附近，但找不到任何具体的东西。如何将MPI与GPU混合使用？是否有一种方法来查询和验证“哦，这个等级是GPU，所有其他都是CPU”?有推荐的教程

浏览 0提问于2012-04-09得票数 10

回答已采纳

1回答

在vscode中，如何在slurm集群的计算节点上进行调试？

、、、、

这是我的困境然后，应用带有gpu的计算节点。我想知道有什么解决办法吗？

浏览 22提问于2021-04-03得票数 1

1回答

从内核线程中查找设备ID

在一个具有多个GPU的节点上，GPU被从0向上分配一个唯一的id来区分它们。在CUDA中，是否有方法让运行在GPU上的内核代码中的线程知道它正在执行的设备的id是什么？目前，我正在通过将每个GPU一个int传递到它的常量内存来完成这个任务，但是我想可能有一个

浏览 2提问于2015-11-23得票数 0

回答已采纳

2回答

基于gdb的分布式软件调试

、、、、

目前，我正在使用linux在C++中开发一个分布式软件，该软件在20多个节点上同时执行。因此，我发现最具挑战性的问题之一是如何调试它。我听说可以在单个gdb会话中管理多个远程会话(例如，在主节点上创建gdb会话，在每个其他节点使用gdbserver启动程序)，是否有可能？如果是的话，你能举个例子吗？你知道其他方

浏览 5提问于2014-02-09得票数 6

回答已采纳

1回答

Kubernetes调度GPU-pods负载均衡

、、

有一个具有n个节点的kubernetes集群，其中一些节点上安装了多个NVIDIA 1080Ti GPU卡。问题:当在安装了GPU的节点上调度启用了GPU的pod时，我希望能

浏览 2提问于2019-07-23得票数 1

2回答

云扳手中的提示USE_ADDITIONAL_PARALLELISM是做什么的

在文档中，我们可以在这里找到一个名为USE_ADDITIONAL_PARALLELISM的查询提示：它是如何与节点的数量进行扩展的？它需要一个从不同的拆分中选择数据的查

浏览 4提问于2020-02-21得票数 0

回答已采纳

1回答

AKS中包含具有多个vCPU的虚拟机的节点池

、、

假设我有一个包含8个vCPU的虚拟机的节点池。我可以在我的yaml清单中指定哪个vCPU将执行该作业吗？我通过指定containers在具有多个GPU的节点池中执行类似的操作。我需要对CPU执行同样的操作。

浏览 10提问于2020-06-06得票数 0

2回答

使用Google Kubernetes引擎，是否可以拥有具有单个区域节点池的多区域主集群？

、、

我希望在多个区域中拥有主节点，然后将节点池连接到单个区域，这样我就可以利用不同区域中不同的gpu加速器类型。每当我尝试在多个区域中创建一个集群时，它都会在每个区域中复制我的节点。这对我来说真的很浪费，因为我一次只需要一个gpu。

浏览 19提问于2019-01-27得票数 0

回答已采纳

1回答

CALayer选择哪个GPU

、、、、

在具有多个GPU的机器上，是否可以编程地告诉CALayer使用哪个GPU？我似乎无法在网上或苹果的文档中找到任何有关这方面的信息。如果您不能选择，如何确定合适的GPU？

浏览 0提问于2020-01-30得票数 0

回答已采纳

1回答

多项式上的Hadoop融合

我需要使用hadoop在多节点集群上挂载HDFS。我怎样才能做到这一点？我已经成功地在单节点集群上部署了fuse，但我怀疑它能否在多节点上工作。有人能把这件事弄清楚吗？

浏览 3提问于2014-03-18得票数 0

回答已采纳

2回答

使用Jenkins作为中心设置selenium网格节点的最佳方法？

、

这是一个开放的问题，如果有更好的地方张贴它，请告诉我。我有大量的selenium测试，我想使用Jenkins运行。目前，我让Jenkins运行selenium网格插件，从而充当集线器，让运行selenium服务器的Windows VM作为我使用远程桌面访问的节点(Jenkins在linux中运行，我需要使用IE进行测试，因此不能使用Jenkins框作为节点)。我试图将selenium服务器作为一个服务运行，但这是行不通的</

浏览 0提问于2017-08-21得票数 3

2回答

在分布式计算中，世界的大小和排名是什么？

、、、

我一直在阅读和，其最终目标是为分布式计算编写脚本(运行PyTorch)，但这些概念使我感到困惑。让我们假设我们有一个具有4个GPU的节点，并且我们希望在这4个GPU上运行我们的脚本(即每个GPU一个进程)。在这种情况下，世界排名和排名分别是多少？我经常找到关于世界规模的解释:工作所涉及的过程总数，所以我假设在我们的例子中这是四个，但是排名呢？为了进一步解释它，另一个具有<

浏览 1提问于2019-10-07得票数 29

回答已采纳

1回答

理解qsub中的-t选项

、、

关于-t选项在使用qsub提交作业时所做的工作，文档有点不清楚。下面是一个出错的例子，我请求了2个节点，每个节点8个进程，以及一个由16个作业组成的数组。我原本希望它能自然地分布在这两个节点

浏览 0提问于2016-06-12得票数 3

回答已采纳

2回答

CUDA是否允许同一gpu上同时运行多个应用程序？

、

我有英伟达的Tesla K20m GPU卡。在CUDA 5.0中，允许在同一图形处理器上来自同一应用程序的多个进程。CUDA是否允许在同一GPU上同时执行不同的应用程序？

浏览 1提问于2014-09-22得票数 3

1回答

如何在dask分布的单个工作人员上管理GPU资源？

、

我有一个关于的问题。假设我想运行一组任务，每个任务运行在不同数量的GPU上，例如，一个任务运行在2个GPU(类型A)上，而其他几个任务运行在1个GPU(B类型)上。我的理解是，可以使用"resources“属性设置多个工作人员。例如，我可能总共拥有3个GPU，并设置了一个带有资源变量"gpus=2“的工作人员和一个带有"gpus=1”的</e

浏览 5提问于2017-05-20得票数 4

回答已采纳

1回答

在Windows 7中使用开放式MPI和CUDA

、、、、

我试图运行一个简单的CUDA程序，它使用OpenMPIv1.6.1 (64位)在Windows 7专业64位计算机中查询节点中的GPU数量。当我在根节点中运行应用程序时，将得到正确的GPU计数。但是，当同一个应用程序尝试使用Open在不同的节点中远程运行时，GPU计数为0，即显示为根和具有CUDA 2.1功能的</em

浏览 4提问于2012-09-18得票数 4

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

TensorFlow matmul会在图形处理器上并行运行吗？(或任何GPU操作。)

添加GPU卡会自动缩放tensorflow的使用吗？

使用CUDA的多GPU编程策略

MPI + GPU* :如何将这两种技术相结合*

在vscode中，如何在slurm集群的计算节点上进行调试？

从内核线程中查找设备ID

基于gdb的分布式软件调试

Kubernetes调度GPU-pods负载均衡

云扳手中的提示USE_ADDITIONAL_PARALLELISM是做什么的

AKS中包含具有多个vCPU的虚拟机的节点池

使用Google Kubernetes引擎，是否可以拥有具有单个区域节点池的多区域主集群？

CALayer选择哪个GPU

多项式上的Hadoop融合

使用Jenkins作为中心设置selenium网格节点的最佳方法？

在分布式计算中，世界的大小和排名是什么？

理解qsub中的-t选项

CUDA是否允许同一gpu上同时运行多个应用程序？

如何在dask分布的单个工作人员上管理GPU资源？

在Windows 7中使用开放式MPI和CUDA

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐