腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
opencl
中
memcpy
的
等价物
我是
opencL
的
新手,这个问题可能看起来很傻。 我有一个内核,它有两个结构A和C。我想把结构A
的
内容复制到结构C。function(__global struct Block *A, __global struct Block *C) {//COPY A to C by
memcpy
alternative } 有没有像
memcpy
这样
的
函数可以在内核中使用?我在零拷贝
的
集成GPU中使用<
浏览 80
提问于2019-06-20
得票数 2
1
回答
第一次clEnqueueMapBuffer调用需要很长时间
、
、
、
、
在YOLO采用
OpenCL
代码时,我遇到了一个性能问题。
memcpy
103clEnqueueMapBuffer 468clEnqueueUnmapMemObject17CL_MEM_ALLOC_HOST_PTR | CL_MEM_COPY_HOST_PTR,
浏览 1
提问于2018-11-12
得票数 2
回答已采纳
1
回答
opencl
1.1
中
的
memcpy
、
opencl
中有没有像
memcpy
这样
的
机制。我想要在gpu上复制一个指针结构,因为我们不能从主机直接复制它们到设备,所以我决定为每个指针创建sepeprate缓冲区,然后将它们放在设备上
的
一个结构
中
。因此,我希望有一种像
memcpy
这样
的
机制,将数据从一个缓冲区复制到另一个缓冲区。有这样
的
东西吗?
浏览 3
提问于2015-03-26
得票数 0
回答已采纳
3
回答
复制不带
memcpy
的
字节
、
、
我在char数组
中
存储了几个不同类型
的
变量。通常我会这样把它们写到数组
中
:
memcpy
(offset, (char*)&a, sizeof(int)) 但是,
memcpy
在
OpenCL
内核
中
不起作用。如果没有这个函数,做同样
的
事情最简单
的
方法是什么?
浏览 36
提问于2017-03-16
得票数 2
回答已采纳
1
回答
opencl
c++ API wrapper
中
clFinish
的
等价物
是什么?
、
我是
opencl
的
新手,但我对GPU编程并不陌生。我需要确保我
的
cpu和gpu设备彼此同步。似乎我应该使用clFinish(cl::commandqueue queue),但我使用
的
是
opencl
c++而不是
opencl
c。那么,cl::finish()是clFinish()
的
等价物
,还是有像cl::commandqueue::finish()这样
的
东西( visual studio无法识别)? 你能举例说明你
的
浏览 0
提问于2019-07-05
得票数 4
1
回答
什么应该取代
OpenCL
内核
中
的
"
memcpy
“?
、
、
扩展C99
的
OpenCL
语言不提供
memcpy
函数。应该使用什么来代替?
浏览 0
提问于2011-04-14
得票数 11
1
回答
OpenCL
slow --不知道为什么
、
、
、
、
我
的
重点是在
OpenCL
中计算自相关向量,这是我改进
的
第一个领域。在我
的
测试文件
中
,这个函数大约需要188 my才能完成。(out, gpu_out, sizeof(float) * sz);根据“仪器”,我
的
OpenCL
实现似乎需要13 my,内存复制开销(gcl_
memcpy
)约为54 my。当我使用一个更大
的
测试文件,1分钟
的
2通道音乐vs,1秒
的
6通道,虽然
OpenCL</em
浏览 4
提问于2013-11-24
得票数 1
回答已采纳
1
回答
在
OpenCL
内核
中
优化memcopy
、
我正在使用
OpenCL
内核,仅仅是为了将一个数组复制到另一个数组(项目的一部分),使用自定义
的
memcpy
函数: for (int i=0; i<n; i++) } 我正在使用
OpenCL
版本2.1
的
OpenCL
支持向量机功能。有没有办法优化复制例程
浏览 22
提问于2019-07-29
得票数 1
1
回答
CUDA
中
async_work_group_copy
的
等价物
、
、
CUDA
中
是否有与
OpenCL
工作组函数async_work_group_copy()、async_work_group_strided_copy()系列对应
的
函数?CUDA似乎有一个内置
的
memcpy
(),但它是每个线程
的
。
浏览 0
提问于2018-08-17
得票数 1
回答已采纳
1
回答
如何获取用于DMA
的
GPU内存
的
物理地址?(
OpenCL
)
、
、
、
我正在写一个
OpenCL
程序,我希望传输数据从一个帧采集卡到图形处理器使用直接存储器访问。我如何才能在图形处理器上获得
OpenCL
缓冲区
的
物理地址来做到这一点?
浏览 2
提问于2012-05-24
得票数 2
2
回答
向cl_float
的
矢量转换
、
、
我一直在努力将二维向量放入
openCL
浮点数组
中
。Input Array NULL, &status);
memcpy
(inMapPtr, input_floa
浏览 2
提问于2013-08-25
得票数 0
回答已采纳
2
回答
在CPU上使用
OpenCL
将一个数组复制到另一个数组比C++代码慢得多。
、
、
、
我比较了运行在CPU上
的
OpenCL
代码
的
性能,它简单地将数据从一个2D数组复制到另一个2D数组
中
,而纯C++代码则做了同样
的
事情。我在
OpenCL
代码中使用了一个工作组来进行公平
的
比较。我使用了英特尔
的
OpenCL
驱动程序和英特尔编译器。
OpenCL
代码比CPU代码慢5倍。编译器为copy循环提供以下消息:对于如
浏览 3
提问于2013-11-20
得票数 2
回答已采纳
1
回答
如何在_cl_devide_id
中
获得“
openCL
”结构
的
大小?
、
、
在
openCL
方法clGetDeviceID
中
,"cl_device_id“参数
的
类型为”cl_device_id *“,并返回指向可用设备列表
的
指针。我试图使用
memcpy
将整个结构传递给另一个变量。为此,我需要知道"_cl_device_id“结构
的
大小。
浏览 2
提问于2021-01-11
得票数 0
回答已采纳
1
回答
通过CUDA实现设备分裂
、
、
我正在寻找一种方法来分区我
的
Nvidia GPU设备,这样我就可以同时运行两组内核,而不会因为SMs而争斗。 根据文档,您可以在
openCL
中使用clCreateSubDevices。是否有任何CUDA
等价物
?
浏览 0
提问于2015-02-11
得票数 1
1
回答
用QtOpenCL编译QT5
、
、
我把我想要在我
的
方法
中
取代
的
肮脏部分留在这里,并描述我在回答中所做
的
事情。我无法提供
opencl
安装
的
包含路径,所以我INCLUDEPATH += " *[absolute path to the
openCL
include folder]* " QMAKE_LIBDIR_
OPENCL
= "*[abso
浏览 4
提问于2013-03-28
得票数 2
1
回答
Opencl
内核本地内存
OpenCL
提供
的
本地内存类似于cuda
中
的
共享内存。在cuda
中
,我们必须使用带有共享内存
的
易失性,因为如果您不将共享数组声明为易失性,那么编译器可以通过在寄存器
中
定位它们来自由地优化共享内存
中
的
位置。但如果线程之间相互通信,这将是一个问题。我
的
问题是,我们是否也必须在
opencl
内核
中
遵循相同
的
方法(使用易失性),如果是,我应该如何做?
浏览 1
提问于2019-07-30
得票数 1
1
回答
OpenCL
设备信息与CUDA计算功能
、
、
、
nVIDIA
的
CUDA具有的概念,在该概念下,它将一系列重要
的
功能标志和数字参数捆绑在一起。在
OpenCL
方面,我知道,但CUDA CC定义所涵盖
的
内容与clGetDeviceInfo提供
的
内容之间
的
设置差异似乎非常明显。此外,我没有真正
的
表,由英特尔或AMD发布
的
clGetDeviceInfo值为他们连续
的
离散或集成
的
GPU。
OpenCL
设备是否有其他机制发布自己
的
信息(可能不
浏览 5
提问于2016-01-29
得票数 0
1
回答
OpenCL
的
enqueueWriteBuffer导致__
memcpy
_sse2_unaligned分割错误
、
、
、
我使用
OpenCL
包装器和英特尔
的
OpenCL
工具包编写了以下C++代码: 如果我从std::aligned_
浏览 2
提问于2017-10-07
得票数 0
回答已采纳
2
回答
GPU/
OpenCL
/OpenGL代码随机分割故障
、
、
我正在编写一个GPU/
OpenCL
NBody代码。我用AMD APP SDK
的
OpenGL渲染粒子
的
位置。在运行代码时,我遇到了随机分段错误。总而言之,我有一个在其中进行OpenGL呈现
的
GLWidget。生成初始位置后,我将在此GLWidget
中
呈现它们。之后,我运行模拟,在每一步,我计算下一个位置并在GLwidget
中
显示它们。signal SIGSEGV, Segmentation fault. 0x00007ffff4a46cd7 in
memcpy
浏览 0
提问于2013-05-01
得票数 1
回答已采纳
1
回答
使用D切片
的
memset()和
memcpy
()
、
、
、
、
在D语言中,下列语句
的
等价物
是什么?int size = 8;int[size] skip;我在想转换应该是: skip[0 .. size-1] = skip[shift .. size-1 ]; //For the
memcpy
浏览 3
提问于2015-08-16
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
OpenCL环境下的并行化编程
谷歌称 TensorFlow 的 OpenCL 可以将推理性能提高一倍
美国广告技术公司Tremor International:公司有不到10%的现金或现金等价物存放在硅谷银行。
OpenCL编程指南
苹果弃用 OpenCL 和 OpenGL ,OpenCL 或遭全面淘汰
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券