我有一个问题是:如果我分配1个矩阵2D并将其存储到GPU中,并且我有2个内核使用相同的矩阵,是否可以使用它来避免再次将该矩阵存储到内核2中?如果它再次为内核2自动复制该矩阵,是否需要时间来再次自动复制它?
发布于 2015-03-17 10:31:16
如果你想在两个内核中使用数据,你不需要在主机和设备之间传输两次数据。一旦你转移了它,它就在图形处理器的内存中,并且会一直留在那里,直到你的程序终止(或者你使用cudaFree显式的释放它)。
只需将指向区域/矩阵的指针传递给两个内核。如果第一个内核修改了数据,第二个内核随后运行(在第一个内核完成之后),第二个内核将看到修改后的数据。
https://stackoverflow.com/questions/29090042
复制相似问题