OpenCL:当只关心线程全局ID时，理想的块数是多少？

文章/答案/技术大牛

发布

1回答

、、、

因此，我是OpenCL的新手，我正在努力更好地理解工作组和工作项。据我所知，单个组中的所有线程(项)都共享内存、原子操作和屏障同步。但是，如果我不需要这些好处，而只关心任何给定线程的全局ID，该怎么办？那么，如果我只关心线程的总数，那么我应该如何选择每个组应该有多少个组和多少个项目？因此，我选

浏览 11提问于2016-09-20得票数 1

回答已采纳

3回答

openCL中的多维内核发布不起作用

、、

我正试图在以下三个维度中启动openCL：size_t localWorkSize[2] = {32, 32};globalWorkSize, localWorkSize,但是只有32个线程被启动还有什么方法可以找到Cuda n openCL线程的等价性？有人能帮忙吗。谢

浏览 0提问于2019-04-05得票数 1

回答已采纳

2回答

为什么CUDA内核在做任何事情之前必须检查“`if (index <n)”？

、

这就是讨厌的样板的定义。显然，在索引>= n的地方，不应该调用内核。 OpenCL不要求您进行这样的边界检查，它已经在内核之外为您完成了。

浏览 11提问于2022-10-05得票数 -3

回答已采纳

1回答

OpenCL -图像、全局和局部工作大小的块处理

、、

我正在尝试优化OpenCL中用于运动估计的块匹配算法。基本上图像大小是384×288，并且假设图像被分成大小为16×16的多个不重叠的宏块，则总共可以实现24x18个宏块。在每个宏块位置，必须估计两个连续帧中的运动(包括使用16x16块搜索像素强度-灰度的绝对差异总和的附近区域)，在启动内核时将全局大小分别设置为24和18是否正确？这是正确<e

浏览 0提问于2017-02-09得票数 0

2回答

在CPU上使用OpenCL将一个数组复制到另一个数组比C++代码慢得多。

、、、

我比较了运行在CPU上的OpenCL代码的性能，它简单地将数据从一个2D数组复制到另一个2D数组中，而纯C++代码则做了同样的事情。我在OpenCL代码中使用了一个工作组来进行公平的比较。我使用了英特尔的OpenCL驱动程序和英特尔编译器。OpenCL代码比CPU代码慢5倍。对于如何使OpenCL代码与C++代码同步，有什么建议吗？谢谢#include <cstdio

浏览 3提问于2013-11-20得票数 2

回答已采纳

1回答

二维阵列使用纹理缓存/ Image2D的缺点？

、、、、

当访问全局内存中的2D数组时，使用纹理缓存有许多好处，比如过滤，而不必那么关心内存访问模式。“数据自动化系统程序编制指南”只指出了一个缺点：但是，在同一个内核调用中，纹理缓存与全局内存写入不保持一致，因此任何纹理获取到通过同一个内核调用中的全局写入写入的地址都会返回未定义的数据。如果我不需要这样做，因为我从来没有写入我读过的内存，那么在使用纹理缓存(或者Image2D，因为我是在

浏览 2提问于2011-08-31得票数 3

1回答

如何规划GPU上的最小二乘计算？

、

在开始处理时，它一次只做一次调整，因此它将调整分成任务，每个任务都需要一些点，所有的点都在一个三角形中。每个线程从队列中获取一个任务，并计算一个小方阵和一个小列向量。当它们都准备好后，调整例程将矩阵和向量相加，并完成最小二乘计算。三角形(x，y，z)的三个角，，点的坐标(x，y，z)。5.3.0-7625-generic, LLVM 9.0.0) Device Vendor

浏览 0提问于2020-07-14得票数 0

3回答

图形处理器中的并行性- CUDA / OpenCL

、

我对图形处理器上的CUDA或OpenCL代码的并行性有一个一般性的问题。我使用的是NVIDIA GTX 470。我在Cuda编程指南中简短地阅读了一下，但没有找到相关的答案，因此在这里提问。我有一个顶级函数，它调用CUDA内核(对于相同的内核，我有它的OpenCL版本)。对于3个不同的数据集(图像数据R，G，B)，这个顶级函数本身在主函数的“for循环”中被调用了3次，而实际的c

浏览 1提问于2011-12-22得票数 4

回答已采纳

3回答

constant内存的访问性能与OpenCL上的global内存相同

CUDA上的常量记忆是一种特定的记忆。而且它比全球记忆更快。但在OpenCL的规范中。我明白以下几个字。__constant或常量地址空间名称用于描述在全局内存中分配并以只读变量形式访问的内核中的变量。所以__constant内存来自__global内存。这是否意味着它与__global内存具有相同的访问性能？

浏览 2提问于2012-08-28得票数 3

回答已采纳

3回答

OpenCL与中央调度的并发编程

、、、、

随着OpenCL 2.0的引入，OpenCL似乎具备了GCD的许多特性，比如CLang/OpenCL风格的块和队列。查看它们各自的功能集，我想知道OpenCL是否能够完成GCD /lib分派所能做的所有事情，但是否具有将计算导向GPU和CPU的额外能力--或者GCD是否可以提供与OpenCL无关的更多功能。具体来说，我的问题是

浏览 8提问于2014-02-01得票数 4

回答已采纳

1回答

NServiceBus -商业许可证的建议工作线程数

、、、

我们最近将我们的NServiceBus从社区升级到商业，它获得了2个内核的许可。当我在线查看示例时，我只看到了1个工作线程的配置。当涉及到商业NServiceBus时，建议的每个核心的工作线程数是多少？或者，在给定系统内存/处理器资源数量的情况下，是否存在多个工作线程？或者这是我需要调整的东西，直到我

浏览 0提问于2011-08-12得票数 2

回答已采纳

1回答

为什么clEnqueueNDRangeKernel会因为浮点异常而崩溃？

、、、、

但它得到的不是排队或返回错误，而是一个浮点异常信号(SIGFPE)。由于IP原因，我无法深入讨论，我很难提供触发此信号的示例。但是-似乎没有任何合法的理由发生这种情况。是否存在该函数本身实际执行无效浮点操作的已知情况？

浏览 5提问于2021-06-06得票数 0

2回答

从Windows中检测和恢复？

、、

我在一些OpenCL代码中遇到了一个奇怪的问题，我每做一次工作，就会启动并重新设置GPU。这个令人反感的内核只运行150 to，在TDR杀死它之前将运行数千次(在许多小时内)，所以我确信内核本身并不是罪魁祸首。是否有一种方法可以检测内核是否已经关闭，以便能够优雅地处理它？

浏览 7提问于2014-04-07得票数 1

回答已采纳

1回答

20个cpu可以运行多少个线程，每个cpu可以运行一个线程？

我的配置：CPU op-mode(s): 32-bit, 64-bitCore(s) per socket: 1NUMA node(s): 1L2 cache: 1024KNUMA node0 CPU

浏览 2提问于2019-11-12得票数 0

3回答

枚举器线程在获得锁后是否安全？

、、

我想知道返回的枚举数是否线程安全：{ return _list.GetEnumerator();} 如果我有多个线程在这个列表中添加数据(也在lock()块中)，并且有一个线程枚举这个列表的内容。当枚举线程完成时，它会清除列表。那么使用从此方法获得的</

浏览 8提问于2014-07-18得票数 4

回答已采纳

1回答

在OpenCL中，当工作组大小不是体系结构的一部分时，__local内存如何才能更快？

、、

如果这个问题很愚蠢，请为我的天真道歉，我是GPGPU编程的新手。我的问题是，既然设备的架构不能改变，那么当用户选择工作组的大小(取决于可分性)时，__local内存如何针对本地工作组中的项目访问进行优化？

浏览 0提问于2016-07-12得票数 2

3回答

循环执行模型的OpenCL

、、、

我目前正在学习OpenCL，并看到了下面的代码片段：int ti = get_local_id(0); 这里是我的问题(主要与for循环有关)：在OpenCL中，for-循环究竟是如何执行的？我知道所有工作项都运行相同的</em

浏览 5提问于2014-06-02得票数 5

1回答

使用向量类型提高OpenCL内核性能

、

我有以下OpenCL内核，它将值从一个缓冲区复制到另一个缓冲区，也可以将值反转(“反向”arg可以是1或-1)：在最近阅读了关于向量的文章之后，我

浏览 0提问于2019-10-23得票数 2

回答已采纳

2回答

如何优化我的OpenCl内核

我已经分离出了一些不同的函数，但它们需要在不同的工作项中并行运行。因此，当内核被调用时，它需要决定必须执行哪个函数。code int idx = get_global_idcall_calc2(); call_calc3();} 如果有256/512工作项，则此代码示例将不是正确

浏览 0提问于2014-05-14得票数 1

回答已采纳

1回答

如何避免OpenCL中的常量内存复制

、、

我编写了模拟简单热流的C++应用程序。它正在使用OpenCL进行计算。OpenCL内核采用二维(n x n)数组来表示温度值及其大小(n)。它在每次循环后返回具有温度的新数组：int t_id = get_global_id(0);{ m_new[t_id / n][t_id % n]= average of its and its neighbors (top,

浏览 1提问于2016-11-19得票数 1

回答已采纳

点击加载更多