有一天,QQ群里有人求助,说CUDA程序执行后没有反应!!
不过这个问题太常见了,经常被问及到
面对这个情况,让我们来说说
CUDA调试正确的打开方式!
1
请依次逐API返回值进行检查,看看他们是否是cudaSuccess
2
如果全部返回都是成功,则可以继续使用nsight进行kernel调试。
kernel调试请使用debug配置编译(默认含有-g), 然后在你的kernel的 开头,用鼠标左键下一个普通断点,然后通过nsight菜单->Start CUDA Debugging。
3
开始检查你kernel的到的参数是否正常。如果有错误的,则你需要重新检查参数的传递。
如果所有参数的传递都正确。 则你的kernel可能存在逻辑BUG。 这就需要耐心慢慢的找了。
4
如果错误是出现在,例如回传的时候, 则往往可能是上一步的kernel出现异步错误(如果你用的是同步cudaMemcpy的话)。此时依然需要检查kernel的。(例如,出现Unspecified Launch Failure, 或者cudaErrorUnknown, 或者具体性的kernel出错)
5
常见的是返回: cudaError Launch Failure。这个时候需要用nsight检查kernel的,往往是越界或者下标错误。只需要在nsight菜单里打开memory checker,然后启动CUDA调试。越界的时候会自动告诉你位置的。
希望这些经验对您调试CUDA代码带来帮助!