首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Cuda优化技术

Cuda优化技术
EN

Stack Overflow用户
提问于 2010-06-22 13:24:41
回答 2查看 2.2K关注 0票数 1

我已经编写了一段CUDA代码来解决NP-Complete问题,但性能并不像我怀疑的那样好。

我知道“一些”优化技术(使用共享内存、纹理、零拷贝...)

CUDA程序员应该知道的最重要的优化技术是什么?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2010-06-22 15:04:36

您应该阅读NVIDIA的CUDA编程最佳实践指南:http://developer.download.nvidia.com/compute/cuda/3_0/toolkit/docs/NVIDIA_CUDA_BestPracticesGuide.pdf

这有多个不同的性能提示和相关的“优先级”。以下是一些最重要的提示:

使用设备的有效带宽来确定主机和设备之间的kernel

  • Minimize内存传输的性能上限-即使这意味着在设备上进行效率不高的计算

  • 合并所有内存和共享内存访问到全局内存访问

  • 避免代码执行分支,因为这会序列化线程
票数 5
EN

Stack Overflow用户

发布于 2011-12-06 09:25:43

新的NVIDIA Visual Profiler (v4.1)支持自动性能分析,以确定应用程序中的性能改进机会。对于检测到的问题,它还直接链接到最佳实践指南中最有用的部分。Visual Profiler作为CUDA工具包的一部分可以在NVIDIA的开发者网站上免费获得:http://www.nvidia.com/getcuda

票数 2
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/3090493

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档