问GPU-带纹理的CUDA中的性能
EN

Stack Overflow用户

提问于 2012-11-21 20:54:49

回答 1查看 465关注 0票数 3

我有一个关于NVIDIA GPU性能的问题。我有一个实现，我在两个数组之间进行插值。使用倾斜到线性内存的纹理比使用CUDA数组更快。目前，我只在一个GPU上试用了它。每个GPU上都是这样吗?或者会有差异吗？我在笔记本电脑上使用GPU。桌面GPU是否更快？因为目前我只获得了2-3的加速。

我可能看起来像一个愚蠢的问题，但我会感谢一个在许多GPU上处理纹理的人的回答。我想知道使用CUDA-Arrays (它应该有一些缓存优化...)速度更慢。

我正在NVIDIA Quadro 2000m上工作，我正在将它与I7-2860QM @ 2,50GHZ (实现)进行比较。这是一场公平的竞赛吗？

回答已采纳

发布于 2012-11-24 22:59:46

具有计算能力2.0或更高缓存全局内存的GPU以及纹理，因此纹理在CC 1.x时代的主要优势已不复存在。

恰恰相反，关于纹理的一个很少提及的事实是，由于需要在硬连线布局的寄存器中存储多个参数和返回值，它们可能会增加寄存器压力。此外，全局内存的缓存比纹理内存的缓存要大。因此，通过纹理读取内存可能比直接访问全局内存慢，这并不令人意外。

即使高端桌面GPU的速度比移动设备快2到5倍，移动或桌面GPU的这一特征也应该是相同的。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/13493749

复制

相似问题

问GPU-带纹理的CUDA中的性能EN