如果是cudaSuccess, 则kernel已经开始启动了, 但这不代表后续的一段时间内, kernel能稳定运行, 需要在下次进行同步调用之类的场合(例如cudaMemcpy和cudaDeviceSynchronize...kernel破坏掉了,此时无法像Host上那样, 通过后续的同步之类的位置, 能返回异步错误检测到子kernel挂了, 这个做不到了.因为此时, 父kernel已经不能正常运行了, 同样的挂了(CPU上能这样检测是因为..., 用打开了cuda memory checker的nsight, 或者cuda-memcheck来检测具体是哪个kernel出现问题.避免找不到地方....只是给拆分成两部分了.实际上这个才是真正的如何在动态并行的时候启动kernel, 而>>则会自动被CUDA编译器转换成这种真正的调用....即可(文本格式, 很方便).需要说明的是, 内置CUDA二次开发支持还有其他方式, 但是已经超过了本章节相关的内容了.