api的概念, 例如需要注意__device__实际上是每模块的(driver api需要考虑同一个进程, 多个context多个模块的问题....实际上这个在动态并行里面, 和普通的__device__, 以及, cudaMalloc/malloc出来的一样.这是动态并行的时候说道__device__和__constant__需要注意的, 以及,...但所有的纹理和表面读取出来的结果都是错误的,
表面写入的结果也是错误的....再类似的, 这里的动态创建的纹理和表面, 实际上则是指的新的纹理和表面对像,这种才能再动态并行的子kernel里中.
本章节的主要问题在于没有直接的指出, 再动态并行的时候, 它们的准确指对....会对读者造成干扰.特别是没有从老CUDA时代走过来的人, 往往会不知所云.但是实际上, 直接写点代码试验就知道指的是什么了.类似的, 这里的段落里的角标1,后面说的, 请参考CUDA Progamming