腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
CUDA
迭代
多个
图像
会
提高
性能
吗
?
、
、
在我设置
CUDA
环境和对我的代码做任何更改之前,我想得到一个输入,看看在GPU上执行下面的代码是否
会
更快。 代码基本上遍历
图像
,并仅当相应的掩码值不为零时才将
图像
像素值复制到dst。如果我
使用
#pragma omp,它确实
提高
了
性能
。所以,问题是,如果我在GPU上执行这段代码(假设我有一块很好的显卡,比如GTX 1050),当每个线程处理一个单独的
图像
时,
性能
会
显著
提高
吗
?
浏览 4
提问于2018-01-18
得票数 0
回答已采纳
4
回答
如何量化
CUDA
设备对C内核的处理权衡?
、
我最近从GTX480升级到了GTX680,希望三倍的内核数量将在我的
CUDA
代码中显着
提高
性能
。令我恐惧的是,我发现我的内存密集型
CUDA
内核在GTX680上的运行速度要慢30%-50%。我意识到这不是严格意义上的编程问题,但它确实
会
直接影响
CUDA
内核在不同设备上的
性能
。谁能提供一些
CUDA
设备的规范,以及如何
使用
它们来推断它们在
CUDA
C内核上的
性能
?
浏览 4
提问于2012-05-26
得票数 11
回答已采纳
2
回答
负载下的ReadWriteLock / SharedLock公平性不佳
、
、
、
为了优化
性能
,我们决定实现一个ReadWriteLock,也就是说,如果
多个
线程只想读取,就可以获得一个锁,但只有一个线程可以持有写锁。 此锁与列表一起
使用
,遍历列表是“读取”操作。现在,这个简单互斥的改变确实
提高
了
性能
,但只
提高
了一定的并发性。如果有更多的线程,那些等待写锁的线程
会
饿死,因为在一个
迭代
器解锁之前,另一个
迭代
器通常已经锁定了。有什么想法/默认方法可以为想要更改列表的线程提供更多的公平性,同时仍然获得更好的<e
浏览 0
提问于2009-10-19
得票数 1
回答已采纳
1
回答
Crossfire/SLI
会
提高
计算着色器的
性能
吗
?
、
、
、
我想知道,如果再增加一个带有Crossfire/SLI的显卡,
性能
是否会有所
提高
。或者在不
使用
Crossfire/SLI的情况下再添加一个视频卡。 有没有人尝试过这个?
浏览 4
提问于2012-07-22
得票数 4
3
回答
用short替换int对
CUDA
中的
性能
有帮助
吗
、
用short替换int是否
会
提高
CUDA
的
性能
?(如short节省了共享内存、寄存器等的
使用
) 欢迎您的建议。谢谢。
浏览 2
提问于2011-09-07
得票数 3
回答已采纳
1
回答
ATLR 4-
迭代
与递归
、
、
假设这个抽象语法树:我设想ANTLR将
使用
递归算法(深度优先遍历)遍历这棵树。我将对这棵树进行多次评估(例如,10 for次)。我可以
使用
迭代
(
使用
我自己的堆栈),而不是
使用
递归算法来遍历这棵树。为了
提高
性能
,我认为
迭代
算法的
性能
会
更好。ANTLR真的
使用
递归遍历
吗
?这真的是一个
性能
问题
吗
? 谢谢!
浏览 1
提问于2014-12-08
得票数 0
2
回答
对
CUDA
/openCL和C++ AMP的混淆
、
、
、
我读到微软正在与Nvidia密切合作,以
提高
AMP的
性能
。我还是很困惑..。
浏览 1
提问于2012-04-25
得票数 15
回答已采纳
1
回答
cuda
大矩阵和块/线程
、
有人能告诉我,如果矩阵大小从5k到10k不等,那是决定启动多少块/线程的最佳方法
吗
?
浏览 4
提问于2013-10-29
得票数 0
回答已采纳
2
回答
DataWeave vs Java
性能
、
、
、
我需要
迭代
近百万条记录。当前的代码是用Dataweave编写的,带有过滤和排序逻辑。然而,我看到了一个
性能
问题。我正在考虑
使用
Java组件将这个DataWeave逻辑转换为Java,看看这样做是否
会
提高
性能
。 如何
提高
代码的
性能
?
浏览 2
提问于2018-09-06
得票数 0
1
回答
多GPU vs GPU集群
、
、
、
我正在
使用
cuda
编程来进行有效和快速的计算。在研究过程中,我发现多gpu和gpu集群是进一步有效计算的另一种手段,但我把这两个术语搞混了。 在编程
cuda
方面,这两者之间的实际区别是什么?
浏览 1
提问于2014-04-03
得票数 0
1
回答
FFT并行化(
使用
CUDA
)
、
在我的应用程序中,我需要转换
图像
的每一行,应用过滤器并将其转换回来。 是这样
吗
?一次执行一个以上的
浏览 2
提问于2013-08-09
得票数 3
回答已采纳
1
回答
关于将数据从设备复制到主机时的thrust::execution_policy
、
、
、
、
我
使用
thrust::copy将数据从设备传输到多GPU系统中的主机.每个GPU都有一个大小相等的数据分区。
使用
OpenMP,我调用每个设备上的函数。在我目前的系统中,我正在开发4个GPU。将数据从设备复制到主机时,两个
迭代
器都作为函数参数传递。 2.
性能
提高
的原因是什么?
浏览 0
提问于2020-09-06
得票数 2
回答已采纳
1
回答
如何在更好的占用率下增加内核执行时间?
、
一个内核每个线程
使用
54个寄存器,占用率为0.33。\n" );如果我注释掉这条If语句,内核会在每个线程中
使用
33个寄存器,占用率也
会
提高
到0.5。但是,奇怪的是,这个新的精简内核实际上多花了15%的时间来执行!有人能解释一下这种
性能
下降是如何发生的
吗
? 我在GTX 580上
使用
CUDA
4.0,代码编译为
CUDA
功能2.0。
浏览 0
提问于2012-02-29
得票数 2
1
回答
如何优化Drools的执行
性能
?
我们在一个规则流组下有1000个规则,我们在执行时有严重的
性能
问题(大约10-20秒)或者创建
多个
入口点可以
提高
性能
?有人遇到过这个问题
吗
? /documentation也欢迎任何链接。
浏览 0
提问于2014-04-16
得票数 2
1
回答
具有大透明区域的重叠UIViews动画
、
、
、
我注意到,当大透明区域的UIImageVIews出现在屏幕上时,
性能
会
显著下降。我是预装我的所有
图像
,并
使用
图像
缓存。我怀疑延迟加载
会
提高
性能
。是否有一种“简单”的方法来
提高
性能
?
使用
cocos2d会改善情况
吗
?
浏览 2
提问于2011-03-08
得票数 0
回答已采纳
1
回答
GPU在Julia集计算中没有
提高
性能
。
、
、
我试图比较CPU和GPU的
性能
。我有过 delete [] data
浏览 1
提问于2013-01-30
得票数 3
回答已采纳
1
回答
MySQL服务器
性能
、
、
如何打开查询日志以查看执行的查询的
性能
?集群设置
会
提高
性能
吗
?谢谢
浏览 0
提问于2012-05-07
得票数 3
回答已采纳
1
回答
提高
CUDA
中运行时确定的嵌套for循环的
性能
、
、
问:在
CUDA
中,有没有一种通用的方法来
提高
嵌套for循环的
性能
,这些循环的条件是在运行时确定的(因此不能由编译器展开)? 背景:我正在研究一种2D
图像
过滤算法的
CUDA
实现。尽管r对于每个
图像
都是恒定的,但滤波器的形状取决于每个像素的值,因此不能将其转换为真正的卷积操作或分解为两个1D操作。输出被分成
多个
块,保存在共享内存中。尽管生成的结果仍然正确,但根据r的值不同,执行速度
会
慢1.5到3倍。通过测试,我得出的结论是,速度变慢是由于运行时确定了上述f
浏览 0
提问于2013-07-18
得票数 0
回答已采纳
1
回答
丹索尔·弗洛。同一台机器上的一组GPU和同一型号的GPU工作良好,另一组则得到OOM错误。
、
、
我正在
使用
多个
GPU (num_gpus = 4)来训练一个模型与
多个
塔。有人知道为什么
会
这样
吗
?调用方表示这不是失败,但可能意味着如果有更多内存可用,则可能
会
提高
性能
。调用方表示这不是失败,但可能意味着如果有更多内存可用,则可能
会
提高
性能
。调用方表示这不是失败,但可能意味着如果有更多内存可用,则可能
会
提高
性能
。
浏览 3
提问于2017-04-15
得票数 0
1
回答
在一个api调用中将多张图片上传到blobstore和GCS
会
减慢进程,甚至会在google应用程序引擎中发生超时
、
、
、
我从前面获得了
多个
图像
数据,我将这些
图像
存储在GCS和blobstore中。因为这个API调用
会
更频繁,而且每个api调用都有许多
图像
,所以有人能帮助我改进这个过程
吗
?
浏览 0
提问于2016-02-14
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一文揭开 NVIDIA CUDA 神秘面纱
CV-CUDA高性能图像处理加速库Alpha发布
一文读懂英伟达的核心和显卡产品线规格-附全部显卡核心对应关系图表
使用Python在GPU上实现两张图像的像素循环赋值
全球首个AI CUDA工程师来了!将PyTorch原生实现提速10-100倍
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券