高性能计算gpu - 腾讯云开发者社区

、、

我们能否通过使用GPU函数的parfor或spmd块的gpuArray来计算CPU的某些部分来提高性能呢？这是一种提高性能的合理方法，还是在此过程中存在局限性？我在某个地方读到，当我们有一些GPU单元时，我们可以使用这个程序。这是除了CPU并行循环之外，我们可以使用GPU计算的唯一方法吗？

浏览 0提问于2015-02-13得票数 0

回答已采纳

2回答

计算优化实例与加速计算实例的区别

、

我刚接触过AWS，遇到了这两种情况，但我不明白它们之间有什么区别--它们看起来是一样的--有人能解释这一点吗加速计算实例使用硬件加速器或协处理器，以比在CPU上运行的软件更有效地执行某些功能这些函数的例子包括浮点数计算、图形处理和数据模式匹配.对于从高性能处理器中受益的计算绑定应用程序来说，计

浏览 5提问于2021-09-11得票数 0

1回答

什么是GPU实例，它与标准实例有什么不同？

、、

我已经读到了很多关于团结5.4中的新特性的辩论: GPU实例。我理解在一般情况下的重要性，无论是在节省内存和吸引电话方面。然而，即使在阅读了一些之后，我仍然无法理解GPU实例和非GPU实例之间究竟有什么不同，更重要的是，所谓的GPU在性能方面的优势来自哪里。谢谢你的知识和任何参考资料。

浏览 0提问于2016-05-29得票数 1

回答已采纳

1回答

集群内GPU的常见拓扑是什么？

、、

我是高性能计算领域的新手，正在学习GPU卡的Allreduce操作。我发现了一种称为ring-Allreduce的高效集合操作，它要求GPU卡的物理拓扑为树型拓扑。GPU卡似乎是通过多条本地PCIe总线和PCIe主桥连接在一起的。是总线拓扑的层次结构吗？

浏览 30提问于2020-02-13得票数 0

回答已采纳

1回答

在Java程序中签入安装了什么GPU

、

我正在编写一个使用外部C++ .exe应用程序的Java程序：如何在我的Java应用程序中签入在当前计算机上安装了什么GPU (以便应用程序知道要运行哪个外部.exe )？不，我不想做Java GPU编程。

浏览 2提问于2014-03-16得票数 0

1回答

CPU-GPU触发器率

、、、、

我需要计算每一个代码应该提供多少个失败值，这样在GPU上运行代码就足以提高性能。1。PCIe 16xv3.0总线能够以15.75GB/s的速度将数据从CPU传输到GPU。3。CPU能够执行400单精度GFLOPs/秒。5。计算可能与数据传输重叠。 6。数据最初放在CPU中。

浏览 2提问于2016-02-25得票数 1

1回答

如何在高性能计算中安装H2O无人驾驶AI？

、、

有没有关于如何在高性能计算(HPC)环境中安装/设置无人驾驶AI的文档，以便我可以请求几个节点(每个节点都有GPU )并让DAI利用它？

浏览 13提问于2019-09-26得票数 0

回答已采纳

1回答

我正在使用两个配置相同的GPU作为我的高性能GPU计算使用OpenCL。其中一个卡是为显示目的连接的，两个程序compiz和x服务器总是使用大约200-300 MB的内存。我的问题是，当使用这些GPU进行计算时，我只能使用GPU中的部分内存，用于显示目的，而第二个GPU则可以使用整个全局内存。在显示GPU的情况下，我只能使用128 MB进行计算，而其他的则可以使用完整的503 MB进行计算。根据页

浏览 7提问于2016-06-02得票数 0

9回答

是否有可能在AMD GPU上运行CUDA？

、、、、

我想把我的技能扩展到GPU计算。我熟悉光线跟踪和实时图形(OpenGL)，但下一代图形和高性能计算似乎是在GPU计算或类似的东西。我目前在我的家庭电脑上使用AMD HD 7870显卡。第二个更普遍的问题是，我从什么地方开始GPU计算？我确信这是一个经常被问到的问题，但我看到的最好的是从08年开始，我认为自那以后这个领域发生了很大的变化。

浏览 27提问于2012-10-10得票数 107

回答已采纳

1回答

为什么这些粒子在使用CSS3图形处理器变换时速度较慢？

、、

我的猜测是，对CSS的每次更改都需要重新计算样式，当元素不被发送到GPU时，重新计算样式的开销会更低。有没有一种方法可以在不重新计算样式的情况下完成我需要的动态转换？有没有办法使用GPU来提高性能？

浏览 2提问于2013-07-09得票数 1

回答已采纳

2回答

使用GPU并行处理和绘制数字

、、、、

(在OpenCL上)在同一个GPU上有效地共享？例如, 谢谢

浏览 3提问于2013-10-01得票数 0

1回答

Python:将计算卸载到GPU

、、

我发现Activity列出了这些脚本不需要高性能GPU，即使我的机器有一个(NVIDIA GeForce GT 750 M 2048 MB)。Paraview (基于VTK)被列为需要高性能GPU。问题:如何使我的脚本从高性能GPU中获益？剧本里有什么我应该设置的吗？

浏览 6提问于2016-08-04得票数 1

1回答

带有ArrayFire的多个主机线程

、、

我们希望通过使用ArrayFire在单个GPU上执行矩阵乘法来提高性能。我很难找到答案，因为我不太精通GPU计算语言。我的印象是某些GPU支持并发内核执行，但我无法确定我们的GPU (Radeon 10)是否支持。任何关于如何使用ArrayFir

浏览 3提问于2018-01-11得票数 2

回答已采纳

4回答

在GPU上运行操作系统内核级计算有意义吗？

、、

我注意到一个GPU可以有数百个内核，这样可以大大加快并行计算的速度。在操作系统内核中，似乎没有并行算法用于加速。人们在用户中进行并行计算的速度与OpenMP相同，但为什么不在内核空间中进行呢？那么，为什么OSes不使用GPU来提高性能和吞吐量呢？在GPU上运行操作系统计算有意义吗？

浏览 3提问于2011-03-09得票数 14

回答已采纳

2回答

如何强制exe文件在windows上的Nvidia GPU上运行

、、

我需要做非常复杂的计算，在正常的CPU上，我的代码大约需要3个月才能完成执行。这就是为什么我试图在我的Nvidia GPU上运行这个程序。代码是在上开发的，我创建了一个EXE文件。这就是我想做的：两种方法都失败了，我的代码运行在我的英特尔GPU</em

浏览 8提问于2022-03-04得票数 1

回答已采纳

1回答

Tensorflow上的训练更改输入大小RNN

、、、、

在GPU上运行同样的东西是否有用，或者我正在做一些逻辑上的错误？

浏览 0提问于2018-04-17得票数 0

1回答

Three.js，什么是改变顶点位置的最有效的方法？

、、、、

我是Three.js的新手，我用了两种方法来移动平面的顶点。我想知道，在性能方面，还是在最佳实践方面，应该使用这两种方法中的哪一种。演示：使用vertexShader: vUv = uv; vec3 newPosition = position; newPosition.z = n

浏览 9提问于2021-05-01得票数 1

回答已采纳

1回答

Azure NCv3和NC T4_v3有什么区别？

、

尽管有一种解释"The NC 3-系列和NC T4 _v3系列的尺寸是为计算密集型的GPU加速应用程序优化的，一些例子是基于CUDA和基于OpenCL的应用程序和仿真、人工智能和深度学习。NC T4 v3-系列的重点是基于NVIDIA的Tesla T4 GPU和AMD EPYC2罗马处理器的推理工作负载。NC 3系列专注于高性能计算和以NVIDIA的NC U.为特色的AI工作负载。

浏览 5提问于2022-10-14得票数 0

1回答

使用数据表运行100,000个Fisher的确切测试比应用慢

、、、

早上好,我尝试使用数据表对融化的，整洁的数据，其中包含大约200,000,000行和四列(主题ID，疾病状态，位置和“值”野生型等位基因的数目，一个3因素变量)。该函数按位置分组，然后对疾病的值进行Fisher精确检验。 ident disease position value2: 2 0

浏览 4提问于2015-01-27得票数 2

1回答

R:对于大的时间序列，有没有快速的近似相关库？

、

我正在尝试制作一个软件，它将实时找到前N个相关的时间序列窗口(查询序列)。目前我正在使用cor函数，但它被证明太慢了。我需要一秒以下的响应时间。低于250ms就很好了，但是在这个范围内的任何东西都可以。如果没有，有没有其他方法可以稍微缩小这个列表？GetTopN<-function(n) Rprof() x<-as.dat

浏览 0提问于2012-02-15得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Matlab如何在CPU并行循环中实现GPU计算？

计算优化实例与加速计算实例的区别

什么是GPU实例，它与标准实例有什么不同？

集群内GPU的常见拓扑是什么？

在Java程序中签入安装了什么GPU

CPU-GPU触发器率

如何在高性能计算中安装H2O无人驾驶AI？

双GPU中的内存使用(多GPU)

是否有可能在AMD GPU上运行CUDA？

为什么这些粒子在使用CSS3图形处理器变换时速度较慢？

使用GPU并行处理和绘制数字

Python:将计算卸载到GPU

带有ArrayFire的多个主机线程

在GPU上运行操作系统内核级计算有意义吗？

如何强制exe文件在windows上的Nvidia GPU上运行

Tensorflow上的训练更改输入大小RNN

Three.js，什么是改变顶点位置的最有效的方法？

Azure NCv3和NC T4_v3有什么区别？

使用数据表运行100,000个Fisher的确切测试比应用慢

R:对于大的时间序列，有没有快速的近似相关库？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐