腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
让
更多
的
工作
项
在
OpenCL
中
并发
运行
?
opencl
我将全局
工作
大小设置为{100,10},将本地
工作
大小设置为{1,1}。预计有100*10个
工作
项
同时
运行
,但结果只有大约50个
工作
项
。 我想知道
如何
让
更多
的
工作
项目同时
运行
?这取决于我
的
代码复杂度吗? 注意:我只使用~100MB全局内存和~100KB私有内存
浏览 40
提问于2021-08-06
得票数 0
1
回答
OpenCL
并发
执行
parallel-processing
、
opencl
、
nvidia
我似乎在某处读到
工作
组
中
的
所有
工作
项
都是
并发
执行
的
。我还读到过一个
工作
组是通过流式传输多处理器来处理
的
。但是,如果
工作
组大小
的
选择使得
工作
项
的
数量超过流式多处理器(nvidia)
中
的
流式处理器
的
数量,该怎么办?那么它们不能
并发
执行吗?
浏览 0
提问于2013-06-14
得票数 0
2
回答
在数据并行内核上打开
运行
并行任务
的
CL
c++
、
opencl
由于我
的
论文
工作
的
原因,我目前正在阅读
OpenCL
框架。到目前为止,我遇到
的
情况是,你可以在数据并行或任务并行
中
运行
内核。现在我有一个问题,但我找不到答案。然而,现在假设你有10+不同
的
向量,也需要求和。有没有可能以任务并行
的
方
浏览 1
提问于2016-01-27
得票数 1
1
回答
如何
使用并行
运行
的
多个
工作
项
调用单个
工作
组?
opencl
我
在
OpenCl
的
初创公司还在学习。(但在不同
的
工作
组
中
)。调用内核
的
另一个C代码(用于包含4个
工作
项
的
一个
工作
组)size_t local_item_size(这就是为什么它完成了第一个
工作
项
,然后被卡在第二个和rest永远不
浏览 1
提问于2014-04-30
得票数 1
回答已采纳
1
回答
无法在内核程序
OpenCL
中
声明静态变量
function
、
static
、
opencl
、
mql5
下面是内核
的
代码:error: variables in function scope cannot be declared static 请告诉我
在
OpenCL
内核程序函数中有什么可以替代static
的
?
浏览 1
提问于2018-04-23
得票数 0
2
回答
OpenCL
与OpenMP性能
opencl
、
gpgpu
有没有研究比较
OpenCL
和OpenMP
的
性能?具体地说,我感兴趣
的
是使用
OpenCL
启动线程
的
开销成本,例如,如果将域分解为非常大量
的
单独
工作
项
(每个
工作
项
由一个执行小任务
的
线程
运行
),而在OpenMP
中
,较重
的
线程是将域分解为数量等于核心数量
的
子域似乎
OpenCL
编程模型
更多
地针对大规模并
浏览 0
提问于2011-09-01
得票数 32
回答已采纳
1
回答
我可以控制我
的
GPU
中
的
特定集群吗?
kernel
、
opencl
、
gpu
我是
OpenCL
的
新手。例如,假设我
的
GPU架构如下: 经纱尺寸: 32 ( 1)我可否同时执行14
项
不同
的
工作
?( 2)若然,应
如何
处理?用例子解释清楚(用一些线程数) 谢谢.)
浏览 3
提问于2013-02-11
得票数 0
回答已采纳
2
回答
OpenCL
单
工作
项
VS NDRange内核
opencl
、
gpu
、
fpga
、
pipeline
我是新手,
在
OpenCL
上使用
OpenCL
进行块密码加密。我读了一些论文,知道
Opencl
中有两种内核(单一
工作
项
和NDRange)。NDRange内核
的
函数不会被编译器自动流水线处理,而单个
工作
项内核
的
函数会被自动流水线处理。 是否建议
在
FPGA上实现单个
工作
项内核而不是NDRange内核?为什么?如果我想
让
内核循环
运行
直到读取所有数据,那么内核(一次从主机获取
浏览 1
提问于2017-08-10
得票数 1
3
回答
OpenCL
与中央调度
的
并发
编程
concurrency
、
opencl
、
objective-c-blocks
、
grand-central-dispatch
、
libdispatch
随着
OpenCL
2.0
的
引入,
OpenCL
似乎具备了GCD
的
许多特性,比如CLang/
OpenCL
风格
的
块和队列。查看它们各自
的
功能集,我想知道
OpenCL
是否能够完成GCD /lib分派所能做
的
所有事情,但是否具有将计算导向GPU和CPU
的
额外能力--或者GCD是否可以提供与
OpenCL
无关
的
更多
功能。具体来说,我
的
问题是
浏览 8
提问于2014-02-01
得票数 4
回答已采纳
1
回答
OpenCL
、多
工作
组/内核?
kernel
、
opencl
1: -1);我
在
OpenCl
()上做了一些阅读,我已经安装了库,并编译了我自己
的
主机。这就引出了第一个问题 这个类
在
OpenCL
中
不存在,所以我想我需要创建一个内核来容纳这个类。因为它不是数组(大多数
OpenCL
教程都讨论了
如何
让
OpenCL
同时为数组
中
的
多个元素赋值)。
如何<
浏览 3
提问于2012-10-25
得票数 0
3
回答
循环执行模型
的
OpenCL
loops
、
parallel-processing
、
opencl
、
gpu
代码和教程
的
全部内容都可以找到。
在
OpenCL
中
,for-循环究竟是
如何
执行
的
?我知道所有
工作
项
都
运行
相同
的
代码,而
工作
组
中
的
工作
项
试图并行执行。因此,如果我
在
OpenCL
中
运行
一个for循环
浏览 5
提问于2014-06-02
得票数 5
1
回答
OpenCL
全局大小或每个
工作
项
的
for循环?
loops
、
kernel
、
opencl
、
gpu
、
mali
我阅读了"
OpenCL
Programming by Example“一书和”
在
Mali T600 GPU上优化
OpenCL
内核“文档。
在
书中
的
示例
中
,他们使用了一些全局大小
的
工作
项
,并且每个
工作
项
在
for循环中处理几个像素。
在
文档
中
,内核是
在
没有循环
的
情况下编写
的
,因为内核<em
浏览 5
提问于2016-05-09
得票数 1
1
回答
我是否应该使用GLSL或
OpenCL
制作我
的
射线追踪器,以及
如何
获得一个大
的
1gb缓冲区?
opengl
、
graphics
、
glsl
、
opencl
、
shader
缓冲纹理有一个有限
的
大小,
在
我
的
GPU是大约200 my,我完全忘记它是什么。 我需要我
的
数据结构
在
1gb左右。有人向我推荐
OpenCL
来解决这个问题,所以我学习了
OpenCL
,现在我已经熟悉了这个API。但是,我发现
OpenCL
在
最大缓冲区大小方面也有类似的问题。大多数GPU只允许您在一个缓冲区
中
访问整个vram
的
1/4。大多数GPU有1或2个gbs
的
vram,因此为我
浏览 5
提问于2014-07-25
得票数 0
回答已采纳
1
回答
OpenCL
-主内核填充缓冲区,并在子内核上
运行
opencl
、
kernel
作为
OpenCL
的
新手,我想知道是否有可能出现以下情况。这个场景有意义吗?
在</
浏览 0
提问于2012-06-21
得票数 0
回答已采纳
3
回答
关于内核执行期间
的
clEnqueueWriteBuffer()
opencl
我可以在当前正在由
运行
在GPU设备上
的
内核写入
的
缓冲区上调用clEnqueueWriteBuffer()吗?假设我不关心数据
的
冲突,我知道我在做什么。
OpenCL
实现允许这样做吗?
浏览 1
提问于2012-10-04
得票数 0
1
回答
用每个像素
的
openGL修改
openCL
纹理
的
最快方法
opengl
、
textures
、
opencl
、
share
使用OpenGL 4.4和
OpenCL
2.0,假设我只想修改每个帧
的
纹理
的
特定像素。 实现这一目标的最佳途径是哪一种?我应该分享哪个对象?我只能修改有限数量
的
像素吗?我只想要GPU
的
行动。
浏览 1
提问于2013-12-29
得票数 0
回答已采纳
2
回答
OpenCL
:只
运行
基于CPU
的
内核
的
单个实例
opencl
我有两个
OpenCL
内核:第一个是并行任务,第二个是线性任务(LZW)。第一个是并行
的
,
在
GPU上
运行
,第二个是线性
的
,
在
CPU上
运行
。我有一个多核处理器,我真的希望只
在
一个核上
运行
内核
的
单个实例,而不是
在
2+核上
运行
2+实例。这不是生产所必需
的
,而是我对各种类型任务
的
性能
的
学术研究。我现在使用
的
比较愚蠢<em
浏览 1
提问于2011-05-05
得票数 3
回答已采纳
1
回答
OpenCL
工作
组大小
在
OS
运行
时很重要吗?
macos
、
opencl
、
grand-central-dispatch
在
OS X中央调度处理器
运行
时,documentation 指出“
工作
项
被安排在提交给
OpenCL
的
不同任务
中
”。这似乎表明
工作
组本质上是无操作
的
,您应该争取(
工作
项
的
数量)=(硬件线程
的
数量),而(
工作
组
的
数量)是不相关
的
。然而,在其他实现
中
,通过本质上
的
协程(setjmp
浏览 0
提问于2013-04-21
得票数 0
回答已采纳
1
回答
OpenCL
中
的
HyperQ支持
opencl
、
gpu
、
nvidia
我想
运行
在单个GPU上异步执行
的
异构内核。我认为
在
Nvidia Kepler K20(或任何具有计算能力
的
3.5+设备)
中
,这是可能
的
,方法是将每个内核启动到不同
的
流,
运行
时系统根据资源可用性将它们映射到不同
的
硬件队列。
在
OpenCL
中
可以访问此功能吗?如果是这样的话,
OpenCL
中
的
CUDA“流”相当于什么?Nvidia驱动程
浏览 1
提问于2013-05-13
得票数 2
1
回答
有多少线程(或
工作
项
)可以同时
运行
?
opencl
、
gpgpu
我是新
的
GPGPU编程,我正在与NVIDIA实现
的
OpenCL
。
如何
在我的卡片上获得
工作
组
的
数量(并且可以同时
运行
)和在一个
工作
组上
的
<
浏览 5
提问于2011-04-15
得票数 19
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
每天在工作和生活中做的事,我如何用 Python 让它们变得更轻松?
OpenCL环境下的并行化编程
苹果弃用 OpenCL 和 OpenGL ,OpenCL 或遭全面淘汰
GPU并行编程有哪些优点?
谷歌称 TensorFlow 的 OpenCL 可以将推理性能提高一倍
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券