OpenCL NDRange使用率-内核仅更改输出缓冲区的一部分

、

我有一个用三维NDRange调用的内核，但它只改变了输出缓冲区的一部分。内核： __global const float* K2BufIn,{ commandQ_.enqueueNDRangeKernel(kernel_Kernel2_, cl::N

浏览 1提问于2018-02-01得票数 1

回答已采纳

2回答

如何有效地交换OpenCL内存缓冲区？

、、

正如标题所暗示的，我正在寻找如何有效地交换两个OpenCL缓冲区。我的内核使用了两个gloabl缓冲区，一个作为输入，另一个作为输出。但是，我使用相同的NDRange在for循环中调用内核，每次都设置内核参数、将内核排队并交换缓冲区，因为前一个输出缓冲区将是下一次迭代的输入缓冲区种子。这里交

浏览 0提问于2012-06-15得票数 6

回答已采纳

3回答

从另一个OpenCL内核调用OpenCL内核

我在这里的一篇文章中看到，我们可以从OpenCL内核调用函数。但在我的情况下，我也需要将复杂的函数并行化(由所有可用线程运行)，所以我是否也必须使该函数成为内核，并像主内核中的function一样直接调用它？或者对这种情况有什么可能的解决方案？提前感谢

浏览 6提问于2011-10-12得票数 13

2回答

并行复制和opencl内核执行

我想用OpenCL实现一个图像过滤算法，但图像大小非常大(4096x4096)。我知道复制到OpenCL设备的时间可能太长。1)将整张图片分成两部分。2)将前半部分拷贝到设备上。3)在设备上执行镜像过滤内核，然后将镜像的后半部分拷贝到设备上。4)阻止内核执行，直到前半部分完成，然后再次调用内核处理后半部分。5)阻塞，直到

浏览 2提问于2015-05-05得票数 0

1回答

OpenCL内核定时测量0秒或导致SIGABRT

、、、、

我在测量Arch (Manjaro)上一个简单OpenCL内核的时间时遇到了问题。OpenCL测量时间的方法是给我一个0秒的时间，或者根据具体情况给出一个错误。我的问题当在一个大的out[i] = in[i];上执行通内核(基本上是NDRange )时，CPU测量正确的执行时间，而OpenCL报告0。I对输入值进行了双重检查，使其与输出相等--因此内核<

浏览 12提问于2020-01-05得票数 0

1回答

如何正确地初始化这个C++的openCL内核的输入/输出参数？

、、、

这是我第一次编写OpenCL计算单元，所以我开始很小；下面是我的基本测试内核： std::cout << value << ", ";我希望在运行内核之后打印输出向量缓冲区的</e

浏览 3提问于2021-11-10得票数 0

回答已采纳

1回答

OpenCL:防止内核缓存

、

我正在使用opencl完成我的第一步，现在遇到了一个问题。我使用的NVIDIA OpenCL库与一个GT540m显卡。我怎样才能防止这种行为？非常感谢。知更鸟

浏览 3提问于2015-05-14得票数 5

回答已采纳

3回答

是否定义从不同内核写入同一个缓冲区？

我有OpenCL 1.1，一个设备，无序执行命令队列，并希望多个内核将它们的结果输出到不同的、而不是重叠的任意区域的一个缓冲区中。有可能吗？kernel_leaf.setArg(2, beg); commandQueue.enqueueNDRangeKernel(kernel, NULL, cl::NDRange(block_size_x), cl::N

浏览 5提问于2015-02-13得票数 0

回答已采纳

2回答

OpenCL矩阵乘法失败

、、

我正在使用OpenCL实现一个矩阵乘法，但问题是我总是得到错误的结果。也许这里有人能给我一个提示，可能是哪里出了错。MatMulKernel.setArg(4, matB.dims.x); cl::NDRangeLocalWorksize(kBlockSize,kBlockSize); cl::NDRange GlobalWorksize(matB.dims.x/(kB

浏览 4提问于2013-01-15得票数 1

回答已采纳

1回答

理解工作项和工作组

、

基于我的问题：图像包含200 * 300 == 60000像素。对于最后一个参数cl::NDRange(20000)，它没有，但只返回图像的一部分。我也不明白，为什么我不能使用这个内核：std::string kernelCode =平台: AMD加速并行处理设备:

浏览 7提问于2014-02-07得票数 1

回答已采纳

2回答

图片缓冲区的opencl矢量/图片缓冲区的海量数据

、

我是openCL的新手，现在的程序有点小问题。我想在我的设备上移动大量的图像，我只需要在我的程序中读取它们。我的问题是，我的设备只允许我分配大约255mb的缓冲区，因为程序应该能够处理不同的参数，并且还应该能够在几台机器上运行，我不知道我可以预先在设备上放置多少图像，但必须在运行时对其进行评估。为此，我想做一些事情，比如创建几个图像缓冲区(纹理)与我的图像存储在其

浏览 4提问于2013-08-15得票数 1

1回答

有人能解释一下这个OpenCL程序出了什么问题吗？

、、、、

我已经在这里包含了主机程序的主要部分，我怀疑它们是不正确的： const char *KernelSource = "\n" "__kernel void sumElements(有可能做这样的事情吗？我需要得到数组中所有元素的总和。

浏览 0提问于2012-11-06得票数 0

回答已采纳

4回答

如何在Xcode4.1中调试OpenCL内核？

、、、

我有一些OpenCL内核不能正常工作，我很想在Xcode中调试它们。这个是可能的吗？如果没有，有没有办法在基于CPU的内核中使用printf()？当我在内核中使用printf()时，OpenCL编译器总是会给我一大堆错误。

浏览 2提问于2011-08-27得票数 7

回答已采纳

1回答

我试图用opencl编写纹理数据，并使用opengl显示它。其目标是比较具有互操作性和不具有互操作性的性能。但现在我无法产生纹理本身。首先，我想尝试在没有互操作性的情况下这样做：this->imageBuffer = new cl::Image2D(*context, CL_MEM_WRITE_ONLYenqueueWriteImage(*(this->imageBuffer), CL_TRUE, origin, range, 0, 0, this->im

浏览 4提问于2020-12-04得票数 0

回答已采纳

1回答

OpenCL image2d_t编写的大部分为零

、

我试图使用OpenCL和image2d_t对象来加速图像卷积。当我注意到输出是所有零的空白图像时，我将OpenCL内核简化为输入和输出的基本读取(如下所示)。稍微调整一下，我就可以把图像的几个零散像素写入输出图像。在调用read_imageui()之前，我已经验证了图像的完整性，直到调用OpenCL内核。我用CommandQueue::enqueueWriteImage()将映像

浏览 2提问于2012-07-18得票数 1

1回答

每次执行后更新opencl中的缓冲区

、

所以我已经写了一段代码，它可以工作了，现在我想做的是多次调用clEnqueueNDRangeKernel()，每次执行后，我想用输出更新一个缓冲区(buffer Y)。我已经写了以下代码，我想知道它是否正确的函数。我没有为它编写单独的setkernelArg()命令。

浏览 5提问于2018-08-12得票数 0

1回答

OpenCL Copy-一次共享大量内容

我正在使用OpenCL实现一个解决方案，我想做以下事情，例如，你有一个大的数据数组，你想在图形处理器中复制一次，并让许多内核处理这些数据的批处理，并将结果存储在它们特定的输出缓冲区中。真正的问题是哪种方式更快？将每个内核与它需要的数组的一部分排入队列，或者提前传递整个数组，并让每个内核(在相同的上下文中)处理所需的批处理，因为它

浏览 1提问于2013-05-05得票数 3

回答已采纳

2回答

OpenCL不发散if()，后面跟着printf()，导致大量减速和内核代码干扰最大工作组大小

、

我是OpenCL的新手，我在几个地方读到过应该避免if/else结构的文章，主要是因为当线程的计算不同时(发散分支)，就会出现明显的减速。一个观察：I有一个内核(128个工作组，每个工作组有128个工作项)，它调用函数foo()，if/位于foo()内。，如果注释掉整个if()语句(条件+打印)，整个程序(主主机+内核+ foo)需要大约90秒的来运行，如果在if()上删除所有打印并使用单个虚拟赋值(例如z=0)，则程序大约需要2

浏览 6提问于2021-08-11得票数 2

回答已采纳

1回答

opencl -多次使用图像

、、

, int height)，它调用内核并读取输出图像数据)。第一个是OK和缩放的，但第二个是损坏的。我不知道为什么，src映像是CL_MEM_READ_ONLY | CL_MEM_COPY_HOST_PTR，out映像是用scale函数创建的。是否有一条规则，不能在内核中多次使用图像？还是我错过了什么？编辑：它与cgo一起使用，因此createImage以void*的形式返回cl_mem，因此Go部分不需要包含cl.h。在启动Go程序时调用init(

浏览 2提问于2022-02-08得票数 1

回答已采纳

2回答

内核不会等待事件的发生

、、

我的内核调用有问题。我的代码如下所示：...(512), cl::NDRange(128)), arrayFirst, arraySecond);kernel(); 它位于内核内部，但我没有保证"arrayFirst“的内存分配正确，我检查了OpenCl

浏览 0提问于2015-11-01得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何有效地交换OpenCL内存缓冲区？

从另一个OpenCL内核调用OpenCL内核

并行复制和opencl内核执行

OpenCL内核定时测量0秒或导致SIGABRT

如何正确地初始化这个C++的openCL内核的输入/输出参数？

OpenCL:防止内核缓存

是否定义从不同内核写入同一个缓冲区？

OpenCL矩阵乘法失败

理解工作项和工作组

图片缓冲区的opencl矢量/图片缓冲区的海量数据

有人能解释一下这个OpenCL程序出了什么问题吗？

如何在Xcode4.1中调试OpenCL内核？

write_imagef似乎没有改变任何值。

OpenCL image2d_t编写的大部分为零

每次执行后更新opencl中的缓冲区

OpenCL Copy-一次共享大量内容

OpenCL不发散if()，后面跟着printf()，导致大量减速和内核代码干扰最大工作组大小

opencl -多次使用图像

内核不会等待事件的发生

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐