假设有一个C++函数器:{ int operator() (const int a, const int b) returna+b;};
这个函数器不使用任何不能在图形处理器上执行的函数,但它不能从CUDA内核调用,因为操作符()前面没有__device__声明。我想创建工厂类,将这些函数转换为设备兼容的<e
我希望通过在设备内核中调用thrust::scatter来使其异步(我也可以通过在另一个主机线程中调用它来实现)。thrust::cuda::par.on(stream)是不能从设备内核调用的主机函数。以下代码在图灵架构上使用CUDA 10.1进行了测试。stream;
cudaStreamCreateWithFlags(&stream, cuda