以后再说(虽然不好, 但能用与否是个特性问题, 而用的好不好则是一个使用问题. 就像哪怕暴雨了, 城市里面的下水道虽然排水效果不好,但却不能缺少它, 本章节的动态分配是类似的)....回到malloc上, 这个函数使用的是单独的一个设备端的堆(heap), 默认很小的, 本章节说明了如何扩大它.如果你不扩大它, 会导致一系列的问题, 实际上, 论坛的客户们遇到多次了: http:...()是为了较小的分配而设计的.其实本章节说了, 设备端的分配是对齐到16B的边界的(忘记对齐到边界是什么意思了?..., 每个线程都正好用64B这种而不是80B的边界,会造成一系列的问题, 例如对Cache的低效利用, 或者卡显存的某个bank之类的(NV的手册从来不讲这种问题,但是会默默的为你避免它, 例如这里的16..., 正常的CUDA C程序员都不会大量的使用本章的函数的,例如本章节的2个我举出的例子, 之前说它们不好, 完全可以规避这两个函数的使用的.例如前面说过的例子1中的Linked List的Node的分配和插入