我正在尝试运行以下关于OpenCL的代码。cl::NullRange, cl::NDRange(N), cl::NullRange); // kernel here is the one running test()
我的问题是,既然我们知道OpenCL将并行运行线程,这是否意味着峰值内存将是N * 1000 * sizeof(int)
我读过的OpenCL 2.x管道API,并在khronos.org上浏览了。我对这种只在OpenCL中提供的漂亮功能感到嫉妒,几乎完全是在CUDA中工作(很抱歉,OpenCL并没有恰当地包含CUDA的功能,但这是另一个问题),所以我想问“为什么CUDA没有管道机制”。所以,相反,我会问:
- What info gets written where?of pipes allow passing data between different k