opencl中memcpy的等价物

我是opencL的新手，这个问题可能看起来很傻。我有一个内核，它有两个结构A和C。我想把结构A的内容复制到结构C。function(__global struct Block *A, __global struct Block *C) {//COPY A to C by memcpyalternative } 有没有像memcpy这样的函数可以在内核中使用？我在零拷贝的集成GPU中使用<

浏览 80提问于2019-06-20得票数 2

1回答

第一次clEnqueueMapBuffer调用需要很长时间

、、、、

在YOLO采用OpenCL代码时，我遇到了一个性能问题。memcpy 103clEnqueueMapBuffer 468clEnqueueUnmapMemObject17CL_MEM_ALLOC_HOST_PTR | CL_MEM_COPY_HOST_PTR,

浏览 1提问于2018-11-12得票数 2

回答已采纳

1回答

opencl 1.1中的memcpy

、

opencl中有没有像memcpy这样的机制。我想要在gpu上复制一个指针结构，因为我们不能从主机直接复制它们到设备，所以我决定为每个指针创建sepeprate缓冲区，然后将它们放在设备上的一个结构中。因此，我希望有一种像memcpy这样的机制，将数据从一个缓冲区复制到另一个缓冲区。有这样的东西吗？

浏览 3提问于2015-03-26得票数 0

回答已采纳

3回答

复制不带memcpy的字节

、、

我在char数组中存储了几个不同类型的变量。通常我会这样把它们写到数组中：memcpy(offset, (char*)&a, sizeof(int)) 但是，memcpy在OpenCL内核中不起作用。如果没有这个函数，做同样的事情最简单的方法是什么？

浏览 36提问于2017-03-16得票数 2

回答已采纳

1回答

opencl c++ API wrapper中clFinish的等价物是什么？

、

我是opencl的新手，但我对GPU编程并不陌生。我需要确保我的cpu和gpu设备彼此同步。似乎我应该使用clFinish(cl::commandqueue queue)，但我使用的是opencl c++而不是opencl c。那么，cl::finish()是clFinish()的等价物，还是有像cl::commandqueue::finish()这样的东西( visual studio无法识别)？你能举例说明你的

浏览 0提问于2019-07-05得票数 4

1回答

什么应该取代OpenCL内核中的"memcpy“？

、、

扩展C99的OpenCL语言不提供memcpy函数。应该使用什么来代替？

浏览 0提问于2011-04-14得票数 11

1回答

OpenCL slow --不知道为什么

、、、、

我的重点是在OpenCL中计算自相关向量，这是我改进的第一个领域。在我的测试文件中，这个函数大约需要188 my才能完成。(out, gpu_out, sizeof(float) * sz);根据“仪器”，我的OpenCL实现似乎需要13 my，内存复制开销(gcl_memcpy)约为54 my。当我使用一个更大的测试文件，1分钟的2通道音乐vs，1秒的6通道，虽然OpenCL</em

浏览 4提问于2013-11-24得票数 1

回答已采纳

1回答

在OpenCL内核中优化memcopy

、

我正在使用OpenCL内核，仅仅是为了将一个数组复制到另一个数组(项目的一部分)，使用自定义的memcpy函数： for (int i=0; i<n; i++) } 我正在使用OpenCL版本2.1的OpenCL支持向量机功能。有没有办法优化复制例程

浏览 22提问于2019-07-29得票数 1

1回答

CUDA中async_work_group_copy的等价物

、、

CUDA中是否有与OpenCL工作组函数async_work_group_copy()、async_work_group_strided_copy()系列对应的函数？CUDA似乎有一个内置的memcpy()，但它是每个线程的。

浏览 0提问于2018-08-17得票数 1

回答已采纳

1回答

如何获取用于DMA的GPU内存的物理地址？(OpenCL)

、、、

我正在写一个OpenCL程序，我希望传输数据从一个帧采集卡到图形处理器使用直接存储器访问。我如何才能在图形处理器上获得OpenCL缓冲区的物理地址来做到这一点？

浏览 2提问于2012-05-24得票数 2

2回答

向cl_float的矢量转换

、、

我一直在努力将二维向量放入openCL浮点数组中。Input Array NULL, &status); memcpy(inMapPtr, input_floa

浏览 2提问于2013-08-25得票数 0

回答已采纳

2回答

在CPU上使用OpenCL将一个数组复制到另一个数组比C++代码慢得多。

、、、

我比较了运行在CPU上的OpenCL代码的性能，它简单地将数据从一个2D数组复制到另一个2D数组中，而纯C++代码则做了同样的事情。我在OpenCL代码中使用了一个工作组来进行公平的比较。我使用了英特尔的OpenCL驱动程序和英特尔编译器。OpenCL代码比CPU代码慢5倍。编译器为copy循环提供以下消息：对于如

浏览 3提问于2013-11-20得票数 2

回答已采纳

1回答

如何在_cl_devide_id中获得“openCL”结构的大小？

、、

在openCL方法clGetDeviceID中，"cl_device_id“参数的类型为”cl_device_id *“，并返回指向可用设备列表的指针。我试图使用memcpy将整个结构传递给另一个变量。为此，我需要知道"_cl_device_id“结构的大小。

浏览 2提问于2021-01-11得票数 0

回答已采纳

1回答

通过CUDA实现设备分裂

、、

我正在寻找一种方法来分区我的Nvidia GPU设备，这样我就可以同时运行两组内核，而不会因为SMs而争斗。根据文档，您可以在openCL中使用clCreateSubDevices。是否有任何CUDA等价物？

浏览 0提问于2015-02-11得票数 1

1回答

用QtOpenCL编译QT5

、、

我把我想要在我的方法中取代的肮脏部分留在这里，并描述我在回答中所做的事情。我无法提供opencl安装的包含路径，所以我INCLUDEPATH += " *[absolute path to the openCLinclude folder]* " QMAKE_LIBDIR_OPENCL = "*[abso

浏览 4提问于2013-03-28得票数 2

1回答

Opencl内核本地内存

OpenCL提供的本地内存类似于cuda中的共享内存。在cuda中，我们必须使用带有共享内存的易失性，因为如果您不将共享数组声明为易失性，那么编译器可以通过在寄存器中定位它们来自由地优化共享内存中的位置。但如果线程之间相互通信，这将是一个问题。我的问题是，我们是否也必须在opencl内核中遵循相同的方法(使用易失性)，如果是，我应该如何做？

浏览 1提问于2019-07-30得票数 1

1回答

OpenCL设备信息与CUDA计算功能

、、、

nVIDIA的CUDA具有的概念，在该概念下，它将一系列重要的功能标志和数字参数捆绑在一起。在OpenCL方面，我知道，但CUDA CC定义所涵盖的内容与clGetDeviceInfo提供的内容之间的设置差异似乎非常明显。此外，我没有真正的表，由英特尔或AMD发布的clGetDeviceInfo值为他们连续的离散或集成的GPU。 OpenCL设备是否有其他机制发布自己的信息(可能不

浏览 5提问于2016-01-29得票数 0

1回答

OpenCL的enqueueWriteBuffer导致__memcpy_sse2_unaligned分割错误

、、、

我使用OpenCL包装器和英特尔的OpenCL工具包编写了以下C++代码：如果我从std：：aligned_

浏览 2提问于2017-10-07得票数 0

回答已采纳

2回答

GPU/OpenCL/OpenGL代码随机分割故障

、、

我正在编写一个GPU/OpenCL NBody代码。我用AMD APP SDK的OpenGL渲染粒子的位置。在运行代码时，我遇到了随机分段错误。总而言之，我有一个在其中进行OpenGL呈现的GLWidget。生成初始位置后，我将在此GLWidget中呈现它们。之后，我运行模拟，在每一步，我计算下一个位置并在GLwidget中显示它们。signal SIGSEGV, Segmentation fault. 0x00007ffff4a46cd7 in memcpy

浏览 0提问于2013-05-01得票数 1

回答已采纳

1回答

使用D切片的memset()和memcpy()

、、、、

在D语言中，下列语句的等价物是什么？int size = 8;int[size] skip;我在想转换应该是： skip[0 .. size-1] = skip[shift .. size-1 ]; //For the memcpy

浏览 3提问于2015-08-16得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

第一次clEnqueueMapBuffer调用需要很长时间

opencl 1.1中的memcpy

复制不带memcpy的字节

opencl c++ API wrapper中clFinish的等价物是什么？

什么应该取代OpenCL内核中的"memcpy“？

OpenCL slow --不知道为什么

在OpenCL内核中优化memcopy

CUDA中async_work_group_copy的等价物

如何获取用于DMA的GPU内存的物理地址？(OpenCL)

向cl_float的矢量转换

在CPU上使用OpenCL将一个数组复制到另一个数组比C++代码慢得多。

如何在_cl_devide_id中获得“openCL”结构的大小？

通过CUDA实现设备分裂

用QtOpenCL编译QT5

Opencl内核本地内存

OpenCL设备信息与CUDA计算功能

OpenCL的enqueueWriteBuffer导致__memcpy_sse2_unaligned分割错误

GPU/OpenCL/OpenGL代码随机分割故障

使用D切片的memset()和memcpy()

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐