腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
CUDA优化网格步长环块数
c++
、
multithreading
、
cuda
、
nvidia
我已经开始使用CUDA实现一个简单的一维数组计算。在文档之后,我首先尝试定义最佳块数和块大小。int N_array = 1000000int n_threads = 256; dim3 grid(n_blocks, 1, 1);......in
浏览 2
提问于2022-07-11
得票数 0
回答已采纳
2
回答
如何确定是否正在使用
GPU
卡?
cuda
在CUDA中,是否有运行时API可以判断
GPU
设备是否正在使用?用户是来自视频显示还是GUGPU应用程序?什么是
GPU
占用率
?
浏览 10
提问于2012-12-18
得票数 3
回答已采纳
1
回答
torch.cuda.is_available()返回true,但火炬模型仍在CPU上训练
deep-learning
、
gpu
、
torch
我尝试创建一个新环境,如下所示: 我检查了cuda运行良好,我的
gpu
被检测到,一切似乎都很好。但当我拟合模型时,nvdia-smi在
GPU
上的
占用率
为100%。
浏览 0
提问于2021-03-25
得票数 1
1
回答
用于Maxwell体系结构和计算能力5的CUDA
占用率
表
cuda
我正在尝试使用cuda
占用率
计算器,用于Maxwell
GPU
,它可以满足5的计算能力。不幸的是,select计算能力选项中的
占用率
表允许使用到3.5。
浏览 2
提问于2015-07-03
得票数 0
回答已采纳
1
回答
在代码中共享
GPU
资源
opengl
、
opencl
、
gpgpu
我使用在
GPU
上运行的OpenCL实现了这个计算。从那时起,我观察到OpenGL绘图的视觉延迟太大。更新.因此,
GPU
现在占用较少,但内核工作时间更长。因此,OpenGL变得更慢。因此,看起来OpenGL绘图和OpenCL计算不能同时进行。在
浏览 5
提问于2012-02-08
得票数 1
1
回答
CUDA编程:占用是在不同进程之间实现
GPU
切片的方法吗?
tensorflow
、
cuda
、
cluster-computing
、
gpgpu
、
gpu
可以通过多种方式实现
GPU
共享。我遇到了入住率。我可以使用它在共享
GPU
的进程(例如tensorflow)之间对
GPU
进行切片吗?这里的切片意味着
GPU
资源始终专用于该进程。使用
占用率
,我将获得
GPU
和SMs的详细信息,并在此基础上启动内核,声明为这些
GPU
资源创建块。
浏览 0
提问于2018-08-08
得票数 1
1
回答
batch_size在深度学习模型拟合中的二次幂
deep-learning
、
gpu
、
mini-batch-gradient-descent
我目前正在阅读Keras的作者Francois的“用Python进行深度学习”,在他对小型批处理的一个定义中,他解释说,batch_size的2功能是由于
gpu
中的内存分配/有人能详细说明这一点吗?样本数通常是2的幂,以便于
GPU
上的内存分配。在训练时,使用一个小批处理来计算应用于模型权重的单个梯度下降更新。
浏览 0
提问于2018-12-23
得票数 1
1
回答
有没有办法通过编程的方式知道我们的CUDA代码在哪个
GPU
上运行?
cuda
、
gpu
我想知道我的CUDA内核将在哪个
GPU
上运行,这样我就可以通过编程来决定要使用的最佳块大小,以便最大化任何算法的
GPU
实现的性能。
浏览 0
提问于2018-10-28
得票数 2
3
回答
计算着色器的最佳工作组数
opengl
在OpenGL中,是否有一种动态确定底层硬件的首选工作组大小的方法?或者至少,使用一些被查询的度量来近似它? 在OpenCL,您可以使用一些实现定义的常量来完成这一任务。中,但是到目前为止,我还没有找到类似于OpenGL的东西。
浏览 0
提问于2013-11-22
得票数 5
回答已采纳
1
回答
没有并行运行的CUDA流
c++
、
cuda
、
nvvp
鉴于这一守则: cudaStreamSynchronize(streams[image]); }
查看
请注意,我的内核使用了30个寄存器,并且它们都报告了大约0.87的“已实现
占用率
”。对于最小的图像,网格大小为1
浏览 4
提问于2016-01-18
得票数 1
回答已采纳
1
回答
管理数据自动化系统的占用情况
c++
、
performance
、
cuda
、
gpu
、
nvidia
的网站上看到,要想有好的表现,我们应该考虑以下四点: 因此,我要回顾一下第一件事情,根据
GPU
例如,对于NVidia 1080
GPU
,我读到: int max_blocks = 32; //maximum number of active blocks per SM int max_threads_per_Block= 64; //maximum number of activ
浏览 0
提问于2016-10-17
得票数 1
2
回答
Nvidia的Fermi
GPU
如何向流媒体多处理器发布线程块
cuda
、
gpu
、
multiprocessor
假设我有8个线程块,我的
GPU
有8个SMs。那么
GPU
是如何向SMs发出这个线程块的呢?我想知道哪一个才是现实。提前谢谢。
浏览 5
提问于2013-02-01
得票数 3
1
回答
在CUDA中使用cos和sin的内核在每块使用更多476个线程时失败
cuda
、
nvidia
、
trigonometry
在CUDA计算能力2.0中,我遇到了sin和cos的问题。当为CUDA计算能力1.x编译代码时,不会出现这种情况。我做了一个简单的代码。我在GeForce GTX 550 Ti和GeForce GTX 480上进行了测试,结果都是一样的。这是代码:#include <stdio.h>#include "cuda_runtime.h"#ifd
浏览 6
提问于2013-09-10
得票数 0
回答已采纳
1
回答
当现代
gpu
内存耗尽时,如何利用磁盘上的交换空间?
cuda
、
operating-system
、
virtualization
、
swapfile
后Pascal 可以分配比
GPU
内存更多的内存,这将自动在
GPU
内存和主机内存之间交换。 malloc(1<<20);
浏览 4
提问于2022-10-29
得票数 1
回答已采纳
2
回答
OpenCV图形处理器
占用率
检测
c++
、
opencv
、
cuda
、
gpu
我正在尝试使用
GPU
hog探测器。我的猪有Size(4,4)大小的细胞。然而,在opencv/modules/
gpu
/src/cuda/hog.cu中,它声明 #define CELL_WIDTH 8#define CELL_HEIGHT 8 或者,在opencv/modules/
gpu
浏览 1
提问于2012-10-29
得票数 2
1
回答
Nividia计算视觉探查器选项灰白
cuda
当
占用率
分析被激活时。 这种行为是由于我的旧
gpu
(Quadro FX 580与CC 1.1)。还是因为我设置了错误的复选框?
浏览 2
提问于2011-08-08
得票数 0
回答已采纳
1
回答
服务器重启内存被大量占用?
云服务器
浏览 384
提问于2019-11-03
2
回答
关于寄存器的CUDA内核的优化
optimization
、
cuda
我正在使用CUDA
占用率
计算器来优化我的CUDA内核。目前我使用了34个寄存器和零个共享memory...Thus,每块310个线程的最大
占用率
为63%。当我以某种方式将寄存器(例如,通过共享内存传递内核参数)更改为20或更低时,我可以获得100%的
占用率
。这是一个好方法吗?或者你会建议我使用另一种优化方法吗?
浏览 1
提问于2011-05-19
得票数 4
回答已采纳
1
回答
为什么不能使用
gpu
来降低cpu
占用率
?
c
、
cuda
、
gpu
、
cpu
但是这里有另一种情况,
gpu
和cpu函数必须串行执行,问题是当cpu被
gpu
内核执行阻塞时,cpu进程会暂停吗?如果是,cpu的
占用率
应该很低,对吧?data, d_data, sizeof(int), cudaMemcpyDeviceToHost); return 0;使用top检查cpu
占用率
是否为
浏览 0
提问于2015-07-01
得票数 1
2
回答
CUDA :具有公共(共享)参数的内核并发性
cuda
此外,V1与v0相比,无论是存储效率(存储: 90%,负载: 155%)还是
占用率
(达到52%,理论: 62%)都有很大的提高。根据汤姆的回答,我不知道“如何检查
GPU
是否已满”。v2的内核占据了30%的空间:对我来说,这意味着已经有其他内核的空间了,不是吗?!我刚刚尝试过更小的块/网格大小,但这似乎没有帮助(更糟糕的是:
占用率
下降到10%)。我觉得我错过了什么东西,堵塞了
GPU
,但是,我不知道这是什么。我已经尝试过调整网格的大小,并使用CUDA
占用率
计算器电子表格进行阻塞。结果表明,对
浏览 2
提问于2015-06-08
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Linux查看日志
Linux下查看CPU信息
Linux 查看 SELinux 的状态
linux 基本日志查看命令
Linux查看文件类型命令实验
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券