我有一个关于NVIDIA GPU性能的问题。我有一个实现,我在两个数组之间进行插值。使用倾斜到线性内存的纹理比使用CUDA数组更快。目前,我只在一个GPU上试用了它。每个GPU上都是这样吗?或者会有差异吗?我在笔记本电脑上使用GPU。桌面GPU是否更快?因为目前我只获得了2-3的加速。
我可能看起来像一个愚蠢的问题,但我会感谢一个在许多GPU上处理纹理的人的回答。我想知道使用CUDA-Arrays (它应该有一些缓存优化...)速度更慢。
我正在NVIDIA Quadro 2000m上工作,我正在将它与I7-2860QM @ 2,50GHZ (实现)进行比较。这是一场公平的竞赛吗?
发布于 2012-11-24 22:59:46
具有计算能力2.0或更高缓存全局内存的GPU以及纹理,因此纹理在CC 1.x时代的主要优势已不复存在。
恰恰相反,关于纹理的一个很少提及的事实是,由于需要在硬连线布局的寄存器中存储多个参数和返回值,它们可能会增加寄存器压力。此外,全局内存的缓存比纹理内存的缓存要大。因此,通过纹理读取内存可能比直接访问全局内存慢,这并不令人意外。
即使高端桌面GPU的速度比移动设备快2到5倍,移动或桌面GPU的这一特征也应该是相同的。
https://stackoverflow.com/questions/13493749
复制相似问题