我需要帮助把炭转移到库达内核。这是我的密码:
__global__
void kernel(char** BiExponent){
for(int i=0; i<500; i++)
printf("%c",BiExponent[1][i]); // I want print line 1
}
int main(){
char (*Bi2dChar)[500] = new char [5000][500];
char **dev_Bi2dChar;
...//HERE I INPUT DATA TO Bi2dChar
size_t host_orig_pitch = 500 * sizeof(char);
size_t pitch;
cudaMallocPitch((void**)&dev_Bi2dChar, &pitch, 500 * sizeof(char), 5000);
cudaMemcpy2D(dev_Bi2dChar, pitch, Bi2dChar, host_orig_pitch, 500 * sizeof(char), 5000, cudaMemcpyHostToDevice);
kernel <<< 1, 512 >>> (dev_Bi2dChar);
free(Bi2dChar); cudaFree(dev_Bi2dChar);
}
我使用: nvcc.exe“-gencode=arch=compute_20,code=\"sm_20,compute_20\
谢谢你帮忙。
发布于 2013-10-19 06:30:47
cudaMemcpy2D
实际上并不处理C中的二维数组(即双指针,**
)。注意,文档表示它需要单个指针,而不是双指针。
一般来说,在主机和设备之间移动任意双指针C数组比单个指针数组要复杂得多。
如果你真的想处理双指针数组,那么在这个页面的右上角搜索"CUDA 2D数组“,你会发现如何做它的各种例子。(例如@talonmies 这里给出的答案)
通常,一种更简单的方法是将数组“扁平化”,这样它就可以被单个指针引用,即char[]
而不是char[][]
,然后使用索引算法模拟二维访问。
您的扁平代码应该如下所示(您提供的代码是不可编译的、不完整的代码段,所以我的代码也是这样)
#define XDIM 5000
#define YDIM 500
__global__
void kernel(char* BiExponent){
for(int i=0; i<500; i++)
printf("%c",BiExponent[(1*XDIM)+i]); // I want print line 1
}
int main(){
char (*Bi2dChar)[YDIM] = new char [XDIM][YDIM];
char *dev_Bi2dChar;
...//HERE I INPUT DATA TO Bi2dChar
cudaMalloc((void**)&dev_Bi2dChar,XDIM*YDIM * sizeof(char));
cudaMemcpy(dev_Bi2dChar, &(Bi2dChar[0][0]), host_orig_pitch, XDIM*YDIM * sizeof(char), cudaMemcpyHostToDevice);
kernel <<< 1, 512 >>> (dev_Bi2dChar);
free(Bi2dChar); cudaFree(dev_Bi2dChar);
}
如果您想要一个倾斜数组,您可以类似地创建它,但是仍然可以作为单个指针数组,而不是双指针数组来创建它。
发布于 2013-10-18 22:16:55
https://stackoverflow.com/questions/19459788
复制相似问题