OpenCL访问共享本地内存

、、

我已经写了一段OpenCL内核程序来对图像进行低通滤波。rst[yg * nCols + xg] = (localMem[xl] + image[(yg - 1) * nCols + xg]) / 2;} 在内核代码中，我想访问每个工作组的本地内存并计算值经过实验，我发现它只使用全局内存，而不访问本地内存。我在访问本地内存的代码中做错了什么吗？

浏览 41提问于2020-04-29得票数 0

回答已采纳

2回答

马里/阿德里诺GPU上存在OpenCL本地内存

、、

OpenCL本地内存是否真的存在于马里/Adreno GPU上，还是只存在于某些特殊的移动电话中?如果存在，则使用，在这种情况下，我们应该使用本地内存，例如GEMM/Conv或其他cl内核？。

浏览 9提问于2022-03-22得票数 2

回答已采纳

1回答

使用Nvidia平台为OpenCL配置本地(共享)内存

、、、

我想在我的OpenCL内核中优化本地内存访问模式。我在某个地方读过关于可配置本地内存的文章。例如，我们应该能够配置用于本地mem的金额和用于自动缓存的金额。对于将双精度值存储在本地内存中，这一点似乎是非常关键的。 Nvidia是否提供专门为CUDA用户设置本地内存的功能？对于OpenCL，我找不到类似的方法。

浏览 4提问于2014-09-16得票数 3

回答已采纳

1回答

OpenCL原子添加操作的奇怪行为

、、

对于一个项目，我不得不深入研究OpenCL:事情进行得相当顺利，除了现在我需要原子操作。我在Nvidia图形处理器上执行OpenCL代码，最后一个驱动程序。clGetDeviceInfo()查询CL_DEVICE_VERSION会返回me：OpenCL 1.0 CUDA，因此我想我必须参考OpenCL 1.0规范。

浏览 1提问于2011-11-02得票数 4

回答已采纳

1回答

opencl图像写入(类型化写入)到本地内存

、、、、

我正在尝试将图像写入本地内存。是否可以使用类型化访问共享本地内存，或者我是否应该“手动”写入每个通道？我还没有遇到过任何使用本地内存来处理图像的例子。

浏览 0提问于2014-12-23得票数 0

1回答

PyOpenCL:如何创建本地内存缓冲区？

、、

我有这段代码，我希望有一个256位(8 uint32)的bitstring_gpu作为设备中的本地内存指针：return bitstring 如何让bitstring_buf转到快速的本地内存

浏览 0提问于2015-05-16得票数 2

1回答

目前，我正在通过共享内存键访问共享内存中的大量结构数据。用于预定义的数据元素结构(例如，某些20000+)的内存最初是在共享内存中创建的，然后由同一系统上的应用程序使用共享内存键来使用。Hazelcast是否提供任何内置API或数据结构，以方便访问和维护这些数据，比使用当前共享内存结构更有效？请注意，我正在尝试使用C++版本的Hazelcast库的程序，我将运行在单一的系统上，所有其他应用程序访问共享内存数据。在上述场景中，在<em

浏览 2提问于2017-02-22得票数 0

3回答

GPU共享内存非常小--我能做些什么呢？

、、

在当今大多数OpenCL GPU上，共享内存(OpenCL术语中的“本地内存”)的大小仅为16 KiB。如何解决这个问题？有超过16 KiB共享内存的GPU吗?

浏览 5提问于2011-02-13得票数 18

3回答

如何在OpenCL中使用本地内存？

我最近一直在使用OpenCL，我能够编写只使用全局内存的简单内核。现在我想开始使用本地内存，但我似乎不知道如何使用get_local_size()和get_local_id()一次计算一个“块”输出。例如，假设我想把苹果的OpenCL Hello示例内核转换成使用本地内存的东西。你会怎么做？get_global_id(0); output[i] = input[i] * input[i];如果这个示例不能

浏览 6提问于2010-03-29得票数 44

回答已采纳

2回答

英特尔OpenCL北网发行

、、、、

我试图使用英特尔硬件在Linux上使用OpenCL： i5-6600与Intel HD Graphics 530 -工作正常，但比在W

浏览 8提问于2017-01-19得票数 4

回答已采纳

1回答

OpenCL本地工作本地内存

、、、

我有一个本地内存的问题，具体地说就是存储值的问题。这是加载到程序的文件中的所有内核。: %i Sequence: %i\t Resutl: %i = %i\n", startPlace, sequence, constData[0], constData[1]);程序正在工作，本地内存已保存cmdQueue, gpuControlData->initKernel, 1, NULL, globaId, NULL, 0, NULL, NULL); 但是当我启动相关内核时，保存的值只在第一次启动时保存在<e

浏览 1提问于2017-02-21得票数 0

1回答

OpenCL内存架构和物理内存/缓存(L1/L2...)之间的关系？

、、

OpenCL内存体系结构之间是否有任何直接关系：以及物理GPU的内存和缓存。例如具有1 1GB内存/L1高速缓存/L2高速缓存的GPU卡。这些是否与本地/全局相关。记忆？或者是从全局内存分配的本地/常量/私有内存？-Thanks

浏览 4提问于2012-04-15得票数 3

回答已采纳

1回答

内核开销内存中的OpenCL变量或数组？

、

我正在尝试运行以下关于OpenCL的代码。cl::NullRange, cl::NDRange(N), cl::NullRange); // kernel here is the one running test() 我的问题是，既然我们知道OpenCL将并行运行线程，这是否意味着峰值内存将是N * 1000 * sizeof(int)

浏览 0提问于2016-05-14得票数 0

1回答

如何实际分配本地(共享)内存？

、、、、

作为并行计算的一个抽象概念，每个线程块(CUDA) /工作组(OpenCL)分配本地(共享)内存，并在同一线程块(CUDA) /工作组(OpenCL)中的所有线程之间共享。究竟是如何分配的？它是由块/组的第一个线程分配的，还是在内存控制器创建块之前分配的？还是别的什么？

浏览 1提问于2016-06-24得票数 0

回答已采纳

2回答

ARM马里-如何在CPU和GPU之间共享只读内存对象？

、

我使用ALLOC_HOST_PTR创建了一个内存对象。我想知道以下程序是否有效？我能否访问(只读取) GPU中的内存对象，同时映射(作为只读) CPU中的同一个内存对象？步骤1:取消映射内存对象(以前映射为CL_MAP_READ_WRITE)步骤3:通过CPU和GPU同时读取和处理数据(但是我不会对这个内存对象执行任何写操作)步骤5:使用

浏览 1提问于2014-06-11得票数 0

回答已采纳

1回答

Opencl内核本地内存

OpenCL提供的本地内存类似于cuda中的共享内存。在cuda中，我们必须使用带有共享内存的易失性，因为如果您不将共享数组声明为易失性，那么编译器可以通过在寄存器中定位它们来自由地优化共享内存中的位置。但如果线程之间相互通信，这将是一个问题。我的问题是，我们是否也必须在opencl内核中遵循相同的方法(使用易失性)，如果是，我应该如何做？

浏览 1提问于2019-07-30得票数 1

1回答

英特尔OpenCL编译器:优化结构使用

、、、、

我有一个关于Intel上OpenCL中结构用法的问题。

浏览 0提问于2017-06-03得票数 3

1回答

OpenCL主机可读“线程本地”内存

我需要(主机可读的)线程本地内存为我的OpenCL内核。scalar per thread threadLocalScalar[getThreadId()] += 1; 这是一个基本的“线程本地内存现在，我需要在OpenCL中执行相同的操作(或任何工作方式相同的操作)。到目前为止，我的研究是使用函数get_group_id(0)来获得工作组id (为了简单起见，可以使用工作组大小= 1)。这样，我就知道什么“线程”正在执行，

浏览 1提问于2015-08-30得票数 0

回答已采纳

2回答

OpenCL本地内存声明

、

按如下方式声明本地内存有什么区别： __local int* restrict block_b) 并在内核中声明本地内存什么时候释放内存有什么区别吗？

浏览 0提问于2015-02-08得票数 2

1回答

OpenCL 2.x管道-它们实际上是如何工作的？

、、、

我读过的OpenCL 2.x管道API，并在khronos.org上浏览了。我对这种只在OpenCL中提供的漂亮功能感到嫉妒，几乎完全是在CUDA中工作(很抱歉，OpenCL并没有恰当地包含CUDA的功能，但这是另一个问题)，所以我想问“为什么CUDA没有管道机制”。所以，相反，我会问： - What info gets written where?of pipes allow passing data between different k

浏览 5提问于2016-08-04得票数 5

点击加载更多