(详见我们之前的CUDA编程指南手册或者看下文). 这样带来了高峰值, 在同样的现代科技不改变的情况下(例如都是5nm的台积电的制程)和类似的晶体管数量....然后本实践指南还提纲式的指出了, 除了高线程数量, 高计算峰值, GPU自己的存储器--显存, 也表现出和CPU的内存不同的特点, 这种特点是往往比CPU高的多的带宽。...但是这里依然指出了, 就算不合并的, 充分随机的小片段访存, GPU也依然可能比CPU提供高的多的性能. 这个也是具体我们会下本手册的后续的日子的阅读中, 逐渐的了解到....如此反复, 直到该项目成功的变成了一个充分加速的, GPU上的CUDA项目了.你会看到, 在整个提速期间, 我们都始终维持和验证结果的比对, 这样, 我们始终知道, 我们的每个版本都是可验证的, 每步提速都是有理有据的...特别的说, 针对本手册不太涉及的, 而和我们公司产品有关的, 例如今天的涉及到的传输的内容, 和本实践手册中前面的言辞激烈的评论中, 我们贴切一些实际的嵌入式产品的特色, 进行修正和特别说明.