腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
理解
占用率
计算器
cuda
、
calculator
我很难理解
占用率
计算器。在某些开发代码中,512
线程
工作正常,但1024个
线程
给出了糟糕的数字,我遇到了问题。我想我会玩
占用率
计算器,试图找到对我的代码的任何其他限制,影响结果。我
浏览 2
提问于2012-07-31
得票数 4
回答已采纳
1
回答
CUDA
线程
块大小1024不工作(cc=20,sm=21)
cuda
NVidia Nsight Eclipse版本-Ubuntu12.04 x64 - CUDA设备是NVidia GeForce GTX 560: cc=20,sm=21 (如您所见,我可以使用多达1024个
线程
然而,当我
设置
线程
> 960时,我遇到了一些奇怪的行为。因此,我被迫每个块使用256个
线程
,考虑到这个.xls:,这可能是个不错的主意。 不管怎么说。任何帮助都将不胜感激。
浏览 1
提问于2013-11-12
得票数 3
回答已采纳
3
回答
CUDA,如何选择<<<Blocks,Threads<>>?
cuda
块/
线程
的数量对此影响很大。例如(只是一个问题),是不是最好选择块高,
线程
低?或者反过来呢?
浏览 2
提问于2012-09-30
得票数 9
回答已采纳
1
回答
CUDA优化网格步长环块数
c++
、
multithreading
、
cuda
、
nvidia
或者,它们的定义是否应该使请求的
线程
总数小于可用的CUDA核心数量?(认为以这种方式
设置
的块将通过进行更多的计算来利用网格步长循环)。由于对于这个大数组,请求
线程
的数量大于CUDA核的数量,那么有许多块不活动会有什么惩罚吗?与请求更少的块和保持大部分块有效相比?(这与1.有关)
浏览 2
提问于2022-07-11
得票数 0
回答已采纳
1
回答
如何利用块/网格和
线程
/块?
optimization
、
parallel-processing
、
cuda
在一次测试中,我在一个大小为5000的数字序列上并行运行了算法,每个网格有500个块,每个块有100个
线程
,返回的时间大约是500ms。然后我将数字序列的大小增加到8192,每个网格128个块,每个块64个
线程
,不知何故返回了350ms的结果来运行算法。下面我从一个标准的设备查询程序中获得了我的GPU规格:
浏览 1
提问于2011-07-18
得票数 0
回答已采纳
1
回答
如何在更好的
占用率
下增加内核执行时间?
performance
、
cuda
一个内核每个
线程
使用54个寄存器,
占用率
为0.33。\n" );如果我注释掉这条If语句,内核会在每个
线程
中使用33个寄存器,
占用率
也会提高到0.5。但是,奇怪的是,这个新的精简内核实际上多花了15%的时间来执行!所有其他代码和启动参数(块、
线程
)都是恒定的。有人能解释一下这种性能下降是如何发生的吗? 我在GTX 580上使用CUDA 4.0,代码编译为CUDA功能2.0。
浏览 0
提问于2012-02-29
得票数 2
1
回答
服务器重启内存被大量占用?
云服务器
浏览 362
提问于2019-11-03
2
回答
关于寄存器的CUDA内核的优化
optimization
、
cuda
我正在使用CUDA
占用率
计算器来优化我的CUDA内核。目前我使用了34个寄存器和零个共享memory...Thus,每块310个
线程
的最大
占用率
为63%。当我以某种方式将寄存器(例如,通过共享内存传递内核参数)更改为20或更低时,我可以获得100%的
占用率
。这是一个好方法吗?或者你会建议我使用另一种优化方法吗?
浏览 1
提问于2011-05-19
得票数 4
回答已采纳
2
回答
cuda nbody模拟-共享内存问题
gpgpu
、
cuda
内核参数: 8192个主体,每个块的
线程
= 128,每个网格的块= 64。器件: GeForce GTX560Ti。
浏览 2
提问于2011-08-31
得票数 1
回答已采纳
1
回答
为什么CUDA
占用率
是根据活动翘曲数超过支持的最大翘曲数来定义的
cuda
占用率
被定义为在一个流多处理器上支持的最大翘曲的数目之上的活动翘曲的数目。假设我有4个块在一个SM上运行,每个块有320个
线程
,即10个warps,因此一个SM上有40个warps。
占用率
为40/ 48,假设一个SM上的最大翘曲为48 (CC 2.x)。 但是我总共有320 *4个
线程
在一个SM上运行,而在一个SM上只有48个CUDA核心。为什么入住率不是100%?
浏览 2
提问于2013-03-07
得票数 6
回答已采纳
2
回答
实现
占用率
低的原因
cuda
、
gpgpu
Nvidia 提到了实现
占用率
低的几个原因,其中包括块之间的工作负载分布不均,导致块囤积共享内存资源,直到块完成时才释放它们。建议减少块的大小,从而增加块的总数(当然,我们保持
线程
数不变)。考虑到上述信息,是否应该(为了最大限度地提高性能)将块的大小
设置
为尽可能小(等于翘曲的大小,比如32个
线程
)?也就是说,除非您需要确保更多的
线程
需要通过共享内存进行通信,否则我认为。
浏览 0
提问于2018-05-04
得票数 0
回答已采纳
1
回答
每个SM的
线程
块处于活动状态
cuda
、
gpu
、
gpgpu
在我的40kB共享内存的gtx780上,我如何找到有多少
线程
块可能同时处于活动状态?如何查看每个SM的最大
占用率
?
浏览 1
提问于2018-10-13
得票数 0
2
回答
Java 8应用程序的垃圾收集优化
java-8
、
garbage-collection
1)我们的应用程序: Spring,Java 8我们已经看到,我们的java8应用程序使用的堆大小不会在适当的时候缩小。谢谢你的帮忙!
浏览 3
提问于2017-11-24
得票数 0
回答已采纳
2
回答
为什么这四个并行
线程
在cpu上的负载不相等
c
、
linux
、
pthreads
我已经写了以下简单的代码,它应该加载4个
线程
的CPU核心一样。但htop结果显示,我有一个
线程
的CPU
占用率
为100%,三个
线程
的CPU
占用率
为25%。所以我怀疑调用者
线程
可能在CPU上有更多的负载,我搞混了。有人能告诉我原因吗?
浏览 2
提问于2013-12-12
得票数 2
2
回答
无法登陆到远程桌面?
远程桌面
浏览 943
提问于2018-11-14
1
回答
当数据自动化系统中的短信数量少于可用短信数量时,它们是如何排成短信的?
cuda
、
profiling
、
gpu
、
nvidia
、
nvprof
这个问题产生于在内核中观察到的理论和已实现的
占用率
之间的差异。我知道和。 让我们考虑一个具有计算能力= 6.1和15 SMs的GPU (GTX TITAN,Pascal体系结构,芯片组GP104)。如果我们用512个
线程
配置内核,那么每个
线程
将处理一个元素,我们需要5个块来操作所有数据。而且内核太小了,因此对于寄存器或共享内存,资源的使用没有任何限制。因此,理论
占用率
为1,因为四个并发块可以在一个SM (2048
线程
)中分配,从而导致2048 / 32 = 64活动翘曲(最大值)。然而,已实现的
浏览 0
提问于2017-04-26
得票数 5
回答已采纳
3
回答
在CUDA中增加每个
线程
的寄存器使用量
memory
、
cuda
、
latency
、
cpu-registers
通常,建议降低每个
线程
的寄存器压力以增加warp
占用率
,从而通过warp级多
线程
(TLP)提供更大的机会来隐藏延迟。为了减少寄存器压力,可以使用更多的每个
线程
的本地内存或每个
线程
块的共享内存。当然,通过增加寄存器压力,warp
占用率
会降低,但现在我们使用快速的片上寄存器来隐藏片外存储器延迟。增加每
线程
寄存器使用率的方法是通过展开循环或计算每个
线程
更多的输出数据来增加ILP (这也基本上通过对更多输入执行相同的工作来增加ILP )。这种方法基本上是由Vo
浏览 11
提问于2012-08-31
得票数 5
1
回答
CUDA程序/设备的效率
cuda
、
gpu
每经纱平均活动
线程
与多处理器支持的每经纱最大
线程
数(以百分比表示)的warp_execution_efficiency比率第一个度量是关于时间的,而其他的则是关于
线程
和翘曲的数量。有人能澄清这一点吗?
浏览 0
提问于2019-06-01
得票数 2
回答已采纳
1
回答
我的云服器不能远程桌面了,怎么处理?
登录
、
远程桌面
用远程桌面,登录不了云服器,请问怎么处理?
浏览 368
提问于2018-12-16
1
回答
计算器与nvprof之间的不同
占用率
cuda
、
profiling
我正在使用nvprof来测量已实现的
占用率
,并将其确定为 Occupancy of each Multiprocessor 75% 我使用33个寄存器,144个字节共享内存,256个
线程
浏览 3
提问于2014-05-05
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
linux多线程服务器
Linux系统编程 线程属性
线程池参数设置问题探讨
分享:C语言编程——LINUX 多线程
Linux系统编程 线程同步概念
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券