我想将主机上线性存储器中存储的3d数组转移到设备上更大的(3D)数组中。作为示例(见下文),我尝试将(3x3x3)数组转换为(5x5x3)数组。我希望在主机上获得具有以下模式的2D切片:x x x 0 00 0 0 0 0 其中x是我的数组的值。我对文档的理解有误吗?如果是,有没有其他方法来执行这项操作?要传输的数组的最终大小将被60x60x900到大小为1100x1500x900<em
建议将cudaMemCpy2D()用于2D数组(对于3D数组使用类似的cudaMemCpy3D() ),而不是cudaMemCpy()以获得更好的性能,因为前者分配设备内存更为合适。但是,如果我使用以下内容,则它很可能无法工作:for( int i = 0 ; i < h ; i++ ){}
这不是一个大问题,除非有人试图将数据自动化系统( CUDA )应用到一个现有的项目中,这正是我