腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
OpenCL
与OpenGL互操作性
的
优势
、
、
当我们可以使用OpenGL获得良好
的
速度时,因为它使用了纹理内存和许多内置
的
图形功能(混合,mip map等)。为什么我们需要
openCL
(
openCL
buffers
的
慢信标)和OpenGL
的
互操作性,仅仅是因为我们可以将渲染和计算结合在一起,或者有任何好
的
优势,比如
性能
。我只想知道这一点
的
主要优势,有没有发表
的
论文表明,通过使用与
OpenCL
的
OpenGL互操作性,它们<em
浏览 1
提问于2012-03-29
得票数 5
回答已采纳
1
回答
提高
opencl
的
性能
、
、
我正在尝试用
opencl
实现一些图像处理算法。但正如我所看到
的
,当我使用
opencl
时,完成一个进程大约需要0.5ms,即一帧。有没有比只使用类对象声明初始化
opencl
参数一次,而不是只调用一个函数运行主内核
的
方法呢?我通过创建类来尝试这样做,但当我发现上下文时,设备不能单独声明和使用,并且每次都需要创建。Check
OpenCL
installation!"Check
OpenCL
installation!"
浏览 22
提问于2020-01-09
得票数 2
回答已采纳
1
回答
GPU上
的
矢量编码
我使用
OpenCL
同时在不同
的
GPU和CPU上执行一个过程,以获得高
性能
的
结果。英特尔
的
OpenCL
总是显示一个信息,即内核没有矢量化,所以它只能在不同
的
内核上运行,而不会使用SIMD指令运行。我
的
问题是,如果我重写代码,使SIMD指令可以利用
OpenCL
代码,它是否也会
提高
GPU
的
性能
?
浏览 2
提问于2015-05-11
得票数 3
回答已采纳
1
回答
糟糕
的
OpenCL
ImageSampling
性能
vs OpenGL TextureSampling
、
、
、
、
我最近将我
的
volumeraycaster从OpenGL移植到了
OpenCL
,这降低了大约90 %
的
性能
。我跟踪了
OpenCL
的
图像采样函数
的
性能
下降,它们比各自
的
OpenGL纹理采样函数慢得多。纹理格式(字节而不是浮点数),不同
的
访问模式和不同
的
纹理大小:没有增加 在CL内核中使用-Using缓冲器代替图像来存储数据,并使用自编写
的
三线性插值函数进行采样:将
OpenCL<
浏览 0
提问于2012-06-12
得票数 55
4
回答
AMD CPU与Intel CPU
openCL
的
对比
、
、
、
、
对于一些朋友,我们想使用
openCL
。为此,我们希望购买一台新电脑,但我们问我们最好
的
AMD和英特尔之间使用
openCL
。显卡将是英伟达,而我们在显卡上没有选择,所以我们开始想买英特尔cpu,但经过一些研究,我们发现可能是AMD cpu搭配
openCL
更好。我们没有找到比较两者
的
基准。那么,我们
的
问题是: AMD是否比拥有
openCL
的
英特尔更好?为了
提高
openCL
的
性能
,使用带
浏览 4
提问于2011-06-18
得票数 3
回答已采纳
2
回答
Altera
OpenCL
的
并行实现
、
、
、
我已经研究Altera有一段时间了,通过将计算部分转移到
OpenCL
来改进繁重
的
计算程序。我设法执行了Altera提供
的
向量加法示例,似乎工作得很好。我看过Altera
OpenCL
的
文档,了解到
OpenCL
使用流水线并行来
提高
性能
。 我想知道是否有可能实现并行执行,类似于在VHDL语言中使用Altera
OpenCL
在FPGA中并行执行多个进程。比如在一个可以并行执行
的
设备上启动多个内核?有可能吗?如何检查是否支持
浏览 2
提问于2015-07-08
得票数 3
1
回答
OpenCL
在GTX泰坦上
的
速度是CUDA
的
两倍
、
、
、
我有一个在ArrayFire中实现
的
光束传输算法。我用
的
是
OpenCL
后端和我
的
GTX泰坦卡。使用
OpenCL
,它以每分钟25,000步
的
速度运行。然后我把它切换到CUDA后端,
性能
提高
到每分钟50,000步左右。这有点令人惊讶,但我想它可能使用了
OpenCL
中没有的一些更高级
的
特性。然后我使用我
的
GTX 960卡运行了相同
的
测试。
OpenCL
的
浏览 1
提问于2016-03-31
得票数 0
回答已采纳
1
回答
OpenCL
-
性能
、
我正在使用
OpenCL
,我使用一个矩阵来增加它
的
值,我需要尽可能低
的
应用时间。使用
OpenCL
提高
性能
的
最佳方法是什么?我读过一些关于数据并行性和任务并行性
的
文章,但我并不十分了解它们。
浏览 1
提问于2017-06-20
得票数 1
回答已采纳
2
回答
opencl
矩阵库
、
我想用
OpenCL
将物理模拟算法移植到GPU上,以
提高
性能
;我对
OpenCL
没有经验,我正在四处看看。计算主要是小稠密矩阵(3x3)和向量积、交叉积等。对于这样
的
基本操作,是否有一些“标准”/recommended库?我当然不想自己编码矩阵乘法和倒置(不是时间,而且是无效
的
)。由于
OpenCL
没有类、运算符重载等,我是否必须编写mmul(a,mtrans(b))而不是a*b.transpose()?是否有一些(计划中
的
)
OpenCL
浏览 4
提问于2011-09-05
得票数 7
回答已采纳
2
回答
对CUDA/
openCL
和C++ AMP
的
混淆
、
、
、
我读到微软正在与Nvidia密切合作,以
提高
AMP
的
性能
。我还是很困惑..。
浏览 1
提问于2012-04-25
得票数 15
回答已采纳
1
回答
如何在Emgu CV项目中利用
OpenCL
的
优势
、
、
、
我是使用Emgu
的
新手,并且开始创建一些小
的
示例项目,例如人脸检测,眼睛检测,..etc。如果我能利用
OpenCL
的
优势来使用图形处理器加速这个过程,那就太好了。否则,当我减少scaleFactor时,它会导致大量
的
cpu占用率。我该怎么做呢?谢谢。
浏览 1
提问于2015-02-14
得票数 3
2
回答
Linux ICD加载器- Nvidia GPU,Intel CPU
、
、
、
为了实现负载平衡,我试图同时在英特尔CPU和Nvidia GPU上运行我
的
OpenCL
应用程序。但我
的
问题是只有Nvidia Plattform被发现了。Arch 3.14.6-1-ARCH
o
浏览 1
提问于2014-06-12
得票数 2
回答已采纳
2
回答
链接到
openCL
内核程序内部
的
外部库
、
、
、
我编写了一段openCV代码,需要对其进行并行化以
提高
性能
。我需要知道如何在
openCL
内核中调用openCV函数。干杯,帕拉斯
浏览 2
提问于2012-01-19
得票数 3
2
回答
使用GPU并行处理和绘制数字
、
、
、
、
(在
OpenCL
上)在同一个GPU上有效地共享?例如, 谢谢
浏览 3
提问于2013-10-01
得票数 0
1
回答
AMD Polaris上特定大小
的
矩阵乘法
性能
下降
、
、
、
我有一个将2个矩阵(GEMM)与M=4096、N=4096和K=16相乘
的
OpenCL
代码(即矩阵4096x16浮点数)。 我在Polaris 560,16CU
的
GPU上运行它。代码:https://github.com/artyom-beilis/oclblas/blob/master/gemm/gemm.cl 我注意到这个大小
的
性能
下降非常奇怪,这个大小
的
矩阵乘法有大约8-10 GFlops
的</
浏览 30
提问于2021-06-27
得票数 4
回答已采纳
1
回答
使用英特尔
OpenCl
解决PyOpenCl错误后
的
性能
提升
、
、
、
、
我现在有一些奇怪
的
性能
问题,英特尔
OpenCl
与AMD应用程序相比。code将是用
OpenCl
C编写
的
内核。现在我得到了一个奇怪
的
行为。如果我通过更改函数Mandelbrot中
的
任何内容(例如,任何语法、参数)让程序以错误结束,在IPython控制台中运行此程序并获得错误消息,纠正错误并再次运行,
浏览 0
提问于2015-03-20
得票数 0
1
回答
使用集成图形卡可以获得更高
的
处理速度吗?
、
、
在我
的
一个项目中,我使用了低功耗
的
Athlon 5350 CPU (被AMD称为APU )。它有4个“正常”核心和128个“Radeon”核心。计算机运行基于文本
的
linux发行版。最重要
的
是,我运行我
的
应用程序,它执行一些计算(非常复杂
的
数学)。 我想知道是否有可能通过将部分应用程序委托给
OpenCL
来
提高
应用程序
的
性能
。这完全是假设
的
,因为我对
OpenCL
一无所知。我
的
浏览 4
提问于2016-10-15
得票数 0
1
回答
libGDX是否支持内置在LWJGL中
的
OpenCL
包装器?
、
、
、
、
我最近一直在编写卷积反向传播神经网络
的
程序,我主要使用Java运行程序,使用libGDX进行图形可视化。通过大量
的
研究,我发现要大幅
提高
性能
和效率,我应该在显卡上执行矩阵计算,而不是在CPU上。在浏览了在线资源后,我发现在显卡上执行此类计算
的
主要方式是通过
OpenCl
。经过更多
的
研究,我发现我在Java上支持
OpenCl
的
两个主要选择是通过LWJGL或JOCL。libGDX是建立在LWJGL上
的
,所以我
的</
浏览 7
提问于2017-02-02
得票数 0
回答已采纳
1
回答
OpenCL
内存
的
排列
我有大约10个numpy数组
的
n项。具有全局id
OpenCL
i
的
i工作人员只查看每个数组
的
ith元素。我该如何安排记忆?我正在考虑将图形卡上
的
数组交织在一起,但我不确定这是否会
提高
性能
,因为我不理解工作组内存访问模式。
浏览 3
提问于2013-09-03
得票数 0
回答已采纳
1
回答
在Arm马里GPU中,点积比MAD (乘法和加法)指令更快吗?
、
、
我发现点积与向量add、向量mul(每个核心每个ALU只有一个周期)是相同
的
周期,但不是mad。所以我很好奇mad指令有多少个周期。
浏览 7
提问于2019-10-25
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
谷歌称 TensorFlow 的 OpenCL 可以将推理性能提高一倍
提高JavaScript动画的性能
微软发布 Win10 OpenCL/OpenGL 兼容更新包:提升硬件加速性能
如何提高云计算的性能
快速提高AE性能的小技巧
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券