有一天,QQ群里有人求助,说CUDA程序执行后没有反应!!
不过这个问题太常见了,经常被问及到
面对这个情况,让我们来说说
CUDA调试正确的打开方式!
1
请依次逐API返回值进行检查,看看他们是否是cudaSuccess
2
如果全部返回都是成功,则可以继续使用nsight进行kernel调试。
kernel调试请使用debug配置编译(默认含有-g), 然后在你的kernel的 开头,用鼠标左键下一个普通断点,然后通过nsight菜单->Start CUDA Debugging。
3
开始检查你kernel的到的参数是否正常。如果有错误的,则你需要重新检查参数的传递。
如果所有参数的传递都正确。 则你的kernel可能存在逻辑BUG。 这就需要耐心慢慢的找了。
4
如果错误是出现在,例如回传的时候, 则往往可能是上一步的kernel出现异步错误(如果你用的是同步cudaMemcpy的话)。此时依然需要检查kernel的。(例如,出现Unspecified Launch Failure, 或者cudaErrorUnknown, 或者具体性的kernel出错)
5
常见的是返回: cudaError Launch Failure。这个时候需要用nsight检查kernel的,往往是越界或者下标错误。只需要在nsight菜单里打开memory checker,然后启动CUDA调试。越界的时候会自动告诉你位置的。
希望这些经验对您调试CUDA代码带来帮助!
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有