从Titan-V(计算能力7.0)开始, 和以前的卡不一样的,它是更像CPU那样的线程自由更多的执行,不是以前的GPU卡那样warp总是强制同步执行的。...注意在cuda 9+上, 老卡+老写法+9.2, 会出现编译警告, 但运行起来没事,
而cuda 9+上, 新卡+老写法+9.2, 那就有可能要出问题,
或者是用户用新卡+新写法,但是没有正确的写对,例如需要同步...warp内部的8个或者16个线程, 用户没有正确的指对目标。...因为这样的参数再运行的时候, runtime或者驱动会发现里面的cubin不能运行的,因为版本不对,会强制从PTX来一次重新动态jit编译,而此时的这种编译会自动注意到兼容问题,例如ballot的时候总是用...cuda 9起这种不兼容性的改动. 虽然有点很伤,但长远看, 这是进一步提升卡的性能和潜力, 减轻程序员负担必须要经历的。