假设我在CUDA下的C++中有一个二维数组,存储在共享内存中,如下所示:
__shared__ float arr[4][4]; // C++ has a default row-major ordering默认情况下,C++将以行为主的格式对arr中的元素进行排序。也就是说,它将分配一个连续的内存块,并存储这样的</
我试图(在C中)为大学作业使用合并排序来实现数据库的外部排序算法。可用内存是buffSize块。我发现这个链接非常有用:
sort array a using an in-memory algorithm like quicksort
如果我无权使用除buffSize空间以外的任何内存,因此无法分配链接的a