腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
CUDA内核和流式多
处理器
计算推理速度
cuda
、
gpu
、
nvidia
、
inference
据我所知,NVIDIA
GPU
的CUDA内核数量决定了它运行单个深度学习模型的速度。因此,如果我使用NVIDIA TITAN RTX
GPU
在0.5秒内对一个模型运行推断,该
GPU
具有72个
流
多
处理器
和4608个内核,并且它使用的
GPU
的最大利用率约为10%,我是否可以假设使用了10%的
流
多
处理器
(大约7个)?(我基于这个答案:) 因此,如果我降级到具有3000个CUDA内核的较低
GPU
,理论上它应该仍然能够以相同的0.5秒速度执行推
浏览 2
提问于2020-01-17
得票数 0
1
回答
cuda
gpu
:术语的澄清
cuda
、
gpgpu
在
gpu
的背景下,有人能澄清一下含义的区别:核心,线程
处理器
,
流
处理器
,多
处理器
。 另外,如何了解GTX570图形
处理器
的每个SM的活动块数量限制(计算能力2.0)?此外,设备属性显示我的
gpu
中每个块的最大线程数是1024,但是cuda占用计算器不接受计算能力2.0
GPU
的这个值。有没有新版本的cuda入住率计算器(2.1以后)?
浏览 1
提问于2011-12-28
得票数 2
回答已采纳
1
回答
multiProcessorCount给出了
流
多
处理器
的数量吗?
cuda
根据我迄今为止的理解,以下是硬件“层”: 块由线程组成,由
流<
浏览 2
提问于2013-05-19
得票数 1
1
回答
并发的,唯一的内核在同一个多
处理器
上?
concurrency
、
cuda
、
kepler
、
cuda-streams
在开普勒3.5
GPU
中,使用
流
是否有可能在同一个
流
多
处理器
上拥有多个唯一的内核?也就是说,在一个开普勒
GPU
上同时运行30个内核大小的<<<1,1024>>>,有15个短消息?
浏览 3
提问于2014-06-26
得票数 2
回答已采纳
3
回答
关于库达的问题
architecture
、
cuda
、
gpu
我正在做一个关于
GPU
编程的研究,想了解更多关于CUDA的知识。我已经读了很多关于它的文章(来自维基百科、Nvidia和其他参考资料),但是我仍然有一些问题: 我有一张ATI Radeon视频卡。
浏览 4
提问于2009-12-30
得票数 2
1
回答
理解
流
多
处理器
(SM)和
流
处理器
(SP)
cuda
、
gpu
我试图理解
GPU
的基本架构。我已经经历了很多材料,包括这个。但是,我仍然很困惑,无法得到一个好的照片。 在下面的图像中,我无法理解哪个是
流
多
处理器
(SM),哪个是SP。我认为多
处理器</em
浏览 0
提问于2015-08-26
得票数 9
1
回答
GPU
数据流体系结构
gpu
、
directx
我想知道
GPU
的数据
流
结构。针对CUDA和DirectX分别提出了并行编程模型和图形流水线。但是,我想知道数据
流
结构(比如8086
处理器
的数据
流
结构)。
浏览 0
提问于2012-09-09
得票数 2
1
回答
如何在AWS EC2实例上增加视频内存?
windows
、
amazon-web-services
、
jenkins
、
amazon-ec2
、
windows-server
我使用Windows 2016映像(自定义AMI)作为Jenkins奴隶。我需要将这个实例的专用视频内存增加到8MB。默认情况下,Windows EC2实例的视频内存为0 MB。请给我一个同样的方法。谢谢。
浏览 9
提问于2016-12-23
得票数 0
2
回答
用于求解许多“小/中”线性系统的CUDA
matlab
、
cuda
、
gpu
、
linear-algebra
、
gpgpu
双精度CUDA (GTX 1080ti)与MATLAB (反斜杠)(
GPU
) 256: 0.01161秒(MATLAB) 256: 0.007762秒(
GPU
) 1024: 0.064357秒(MATLAB) 1024: 0.036280秒
浏览 7
提问于2017-07-23
得票数 1
1
回答
GPU
着色器图灵完成吗?
shader
、
gpu
、
gpgpu
、
computation-theory
我知道完整的
GPU
是计算的庞然大物--包括计算的每一步,以及内存。所以很明显,
GPU
可以计算我们想要的任何东西--它是图灵完整的。我的问题是关于各种
GPU
(“
流
处理器
”/“CUDA Core”)上的单一着色器:我(理论上)可以通过使用单个着色器计算任意输入上的任意函数吗? 我试着去理解计算着色的“规模”。
浏览 4
提问于2014-07-04
得票数 13
回答已采纳
2
回答
OpenCL中的最优局部/全局工作大小
opencl
AMD、NVIDIA、英特尔
GPU
是否有通用规则?我是否应该分析设备的物理构建(多
处理器
的数量、多
处理器
中的
流
处理器
的数量等)? 这取决于算法/实现吗?
浏览 2
提问于2013-01-10
得票数 4
1
回答
如何计算每个
流
的webrtc所需的硬件资源
video
、
resources
、
streaming
、
webrtc
、
hardware
我想确切地知道一个包含音频和视频的
流
需要多少
处理器
能力、内存、
gpu
等(可能还需要计算视频和音频的质量),希望我需要一个公式来计算n个
流
的相同内容。此外,我也不确定我应该使用哪种类型的硬件,例如,
处理器
的类型,路由器的类型等。
浏览 0
提问于2018-01-12
得票数 2
1
回答
使用ATI
流
处理器
的
GPU
上的RAR密码恢复
gpu
、
unrar
我是
GPU
编程的新手,使用brook+语言在ATI Stream Processor上进行暴力破解密码恢复,但我看到用brook+语言编写的内核不允许调用任何正常函数(内核函数除外),我的问题是:3)
GPU
(ATI
流
处理器
或CUDA)中的函数工作在此程序中到底扮演了什么角色?
浏览 0
提问于2009-12-26
得票数 5
回答已采纳
2
回答
GPU
上的线程和线程组
multithreading
、
gpu
、
dispatch
、
directcompute
、
threadgroup
我想知道我可以在
GPU
上调度的线程/线程组的“网格”。我正在使用Direct Compute,所以我将给出一个使用该API的具体示例。另外,
GPU
上的线程也有同样的问题。在计算(.hlsl)文件中声明的numthread(2,2,2)和numthread(8,1,1)之间有什么区别? 任何帮助都将不胜感激。
浏览 0
提问于2012-09-22
得票数 12
回答已采纳
1
回答
使用MXNet NDArray进行梯度下降
optimization
、
multidimensional-array
、
mxnet
有没有一种好的方法来做这种约束优化使用MXNet工作在图形
处理器
核心,计算约束梯度等。无需向量化输入并使用中所述的前馈网络解决方法。
浏览 9
提问于2017-07-18
得票数 1
3
回答
特斯拉双精度
double
、
cuda
、
opencl
我正在寻找信息,如何在特斯拉
gpu
中实现双精度硬件。我已经读到,两个
流
处理器
正在研究单双精度值,但我没有找到任何来自nvidia的官方论文。PS 没有帮助
浏览 1
提问于2010-08-11
得票数 3
回答已采纳
1
回答
Tensorflow如何支持Cuda
流
?
tensorflow
Tensorflow是自动利用Cuda流在单个
GPU
上并行执行计算图,还是应该手动将
流
分配给操作/张量?
浏览 4
提问于2016-03-19
得票数 13
回答已采纳
1
回答
如何将任务分配给
GPU
和CPU Dask工作者?
dask
我正在设置一个Dask脚本,以便在PSC Bridge P100图形
处理器
节点上执行。这些节点提供2个CPU和32个CPU核心。我想启动基于CPU和
GPU
的dask-workers。CPU工作进程将启动:而
GPU
工作者则表现为:我的工作
流
由一组仅CPU任务和一组
GPU
任务组成,它们取决于CPU任务的结果。是否有一种方法
浏览 0
提问于2019-08-20
得票数 3
2
回答
OpenCL -如何在每个内核上生成单独的数学进程
opencl
、
gpu
理想情况下,应用程序应该跨NV和AMD
GPU
目标工作,但我没有找到一种简单的方法来确定每个
GPU
上的核心/
流
处理器
的总数。有没有一种简单的方法来确定在任何硬件平台上有多少个核心/
流
处理,然后在每个可用核心上产生一个分解线程?目标RSA模数将在共享内存中,并且每个分解线程都使用Rho模数分解攻击。
浏览 5
提问于2012-04-06
得票数 2
1
回答
CUDA模型中硬件与程序的层次对应关系
cuda
在我目前的理解中,CUDA模型的硬件层次是
GPU
卡->
流
多
处理器
( -> )核,程序层次是内核-> grid ->块-> warp ->单线程。我想知道硬件和程序层次结构之间的对应关系。grid是包含在
GPU
卡中还是SMs中?如果
GPU
卡中包含网格,
GPU
卡可以只包含一个网格还是包含多个网格?block是否对应于SMS?一条短信可以只包含一个块还是多个块?一个块可以跨越多条短信吗?
浏览 0
提问于2013-04-03
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券