我正在尝试写一个代码,将端口openmp线程到一个单一的gpu。我在this.Since上找到的案例研究很少,我不是计算机科学背景的。我在编程方面的技能较少。This is how the basic idea look's like 这是到目前为止开发的代码。 CALL OMP_SET_NUM_THREADS(2)
!
对于我的最后一年项目,我选择构建一个库,开发人员可以使用它来使用CUDA进行GPGPU计算,而不必了解CUDA API (换句话说,CUDA包装器)不同内核实现背后的机制。这个库很可能类似于openMP库。对于那些不熟悉openMP的人来说,它是一个支持C语言的多平台共享内存多处理编程的应用程序接口,其中数据布局和分解由指令自动处理。,我想在GPU上为CUDA并行计算实现相同的功能。但是现在,我想程