腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
如何
获取
cuda
设备
的
核
数
?
c
、
cuda
、
nvidia
我正在寻找一个函数,可以计算我
的
cuda
设备
的
核心数量。我知道每个微处理器都有特定
的
核心,而我
的
cuda
设备
有两个微处理器。我搜索了很多次,想找到一个属性函数来计算每个微处理器
的
内核数量,但是我不能。我使用了下面的代码,但是我仍然需要内核
的
数量?
cuda
7.0 编程语言C visual studio 2013 代码: void printDevProp(cudaDeviceProp devProp
浏览 254
提问于2015-09-12
得票数 23
回答已采纳
2
回答
我不能在
CUDA
内核中设置断点
cuda
、
nsight
我是NSIGHT和
CUDA
的
新手。我试图在我
的
CUDA
内核代码中设置一个断点,但我不能--断点是在内核
的
末尾设置
的
,而不是在我想调试
的
特定行上设置
的
。我正在使用VS2010 (MFC项目)与NSIGHT 2.2和
CUDA
4.2。 我使用“生成
设备
调试
浏览 3
提问于2013-02-27
得票数 1
回答已采纳
1
回答
为什么在我
的
Compute Capability 2.0 GPU上,每台多处理器1536
的
最大线程?
cuda
、
gpu
在我
的
GPU上,使用Capability 2.0,每个多处理器
的
最大线程
数
是1536个。为什么不是2
的
力量?下面是我
的
GPU
的
一些细节:Threads per Warp
浏览 5
提问于2017-05-10
得票数 1
1
回答
流多处理器,每个流处理器在
cuda
中
的
核心
optimization
、
cuda
对于不同
的
nvidia显卡,在不同
的
流多处理器数量和不同
的
处理器
核
数
的
情况下,每个流处理器具有不同
的
特性。我认为我们需要更好地利用
设备
属性来进行更好
的
优化。 在<em
浏览 3
提问于2014-04-22
得票数 4
回答已采纳
2
回答
如何
在
CUDA
FORTRAN中生成随机
数
?
random
、
cuda
、
fortran
我正在寻找一种简单
的
方法来为多线程并行生成0.0和1.0之间
的
随机浮点数。到目前为止,这是我
的
内核。我甚至不确定是否有任何用于
CUDA
FORTRAN
的
随机
数
库。我只需要向正确
的
方向推动,然后我就可以给自己写一个像样
的
随机
数
生成器。 谢谢你
的
帮助
浏览 0
提问于2011-02-04
得票数 2
回答已采纳
3
回答
安装
Cuda
NVIDIA图形驱动程序失败
cuda
、
cuda.net
我是使用
CUDA
编程
的
初学者,我想知道我能不能编译和运行我
的
CUDA
程序而不用安装Nividia驱动程序?
Cuda
工具包和SDK成功地安装在我
的
机器上,但是whenI运行我
的
程序,我无法设置我
的
Cuda
设备
。这是否意味着我需要安装Nividia驱动? 字节)( 2)多处理器x(192个)
CUDA
核
/MP: 384个
CUDA
核
GPU
浏览 1
提问于2012-08-11
得票数 7
1
回答
有多少线程(或工作项)可以同时运行?
opencl
、
gpgpu
我是新
的
GPGPU编程,我正在与NVIDIA实现
的
OpenCL。
如何
在我的卡片上获得工作组
的
数量(并且可以同时运行)和在一个工作组上
的
工作项
的
数量?与CL_DEVICE_MAX_COMPUT
浏览 5
提问于2011-04-15
得票数 19
1
回答
cuda
中
的
临时
设备
指针、重用固定
的
设备
指针或创建和释放
设备
指针
的
更好实践是什么?
cuda
在
cuda
内核函数中,没有自动垃圾收集。
Cuda
中临时
设备
指针
的
更好实践是什么?重用固定
的
设备
指针,还是创建和释放
设备
指针?例如,要为两个向量之间
的
平方误差和编写一个
Cuda
核
函数,更方便
的
是有一个临时
设备
指针来存储两个向量
的
差异,然后将这个临时
设备
指针
的
元素平方和起来。一个选项是为每个函数调用分配一个临时
设备
浏览 2
提问于2017-01-24
得票数 0
回答已采纳
1
回答
如何
设置虚拟环境来运行tensorflow基准测试
python
、
tensorflow
、
benchmarking
我
的
目的是设置虚拟环境来运行,但在运行以下代码后,我在最后一条语句中得到一个错误。我可以问一下我应该怎么做来解决这个问题吗?仅供参考:我使用
的
是Python 3.6.7,其中只安装了pip和virtualenv包,并安装了
CUDA
9.2/cuDNN7 (系统路径中
的
所有dll)。
浏览 36
提问于2018-12-05
得票数 0
回答已采纳
1
回答
如何
使用CuPy在图形处理器上运行python?
python
、
gpu
、
cupy
() cp.
cuda
.Stream.null.synchronize()() cp.
cuda
.Stream.null.synchronize() batch_labels = cp.array(dataset_labels[start_range:end_range]) cp.
cuda</em
浏览 53
提问于2020-02-02
得票数 4
回答已采纳
2
回答
报告
CUDA
加速
的
正确方法
cuda
我想比较在CPU上运行
的
串行程序和在GPU上运行
的
CUDA
程序
的
性能。但我不确定
如何
公平地比较性能。例如,如果我将旧CPU和新GPU
的
性能进行比较,那么我将获得巨大
的
加速比。另一个问题:
如何
将我
的
CUDA
程序与论文中报告
的
另一个
CUDA
程序进行比较(两者都运行在不同
的
GPU上,并且我无法访问源代码)。
浏览 0
提问于2012-09-26
得票数 2
回答已采纳
2
回答
如何
获取
iOS
设备
硬件规格?
ios
、
objective-c
、
iphone
、
ipad
从代码中
获取
iOS
设备
CPU、GPU和内存信息
的
最佳方式是什么?我想知道它有多少个核心,cpu有多少个GHz等等。谢谢。
浏览 0
提问于2014-07-31
得票数 0
1
回答
只允许在具有多核处理器
的
设备
上安装Android应用程序。
android
、
multiprocessing
、
cpu
、
cpu-cores
是否有可能使Android应用程序只在具有多核处理器
的
设备
上可用/可安装?我知道一个应用程序可以为某些Android版本和硬件规格,如前置摄像头。以编程方式解决这一问题
的
一种方法是通过调用Runtime.getRuntime().availableProcessors()来
获取
设备
上
的
核
数
,然后在
设备
不满足我
的
要求时完成该活动,但这可能不是正确
的
方法那么,我该
如何
在谷歌批
浏览 0
提问于2016-02-07
得票数 0
回答已采纳
1
回答
有没有办法通过编程
的
方式知道我们
的
CUDA
代码在哪个GPU上运行?
cuda
、
gpu
我想知道我
的
CUDA
内核将在哪个GPU上运行,这样我就可以通过编程来决定要使用
的
最佳块大小,以便最大化任何算法
的
GPU实现
的
性能。
浏览 0
提问于2018-10-28
得票数 2
1
回答
将结构复制到
设备
内存
CUDA
c++
、
cuda
我是数据自动化系统
的
新手,并且浏览过数据自动化系统
的
工具包文档。在这里,我发现了一个例子,矩阵乘法使用共享内存。这里,当将矩阵结构从主机内存复制到
设备
内存时,只复制数据元素。我无法理解
的
是其他变量是
如何
被复制到
设备
内存中
的
。、步幅和高度是
如何
复制到
设备
内存中
的
。在理解这件事
的
过程中,我是否错过了什么。BLOCK_SIZE * row
浏览 3
提问于2016-11-09
得票数 2
回答已采纳
1
回答
关于
CUDA
的
架构(SM,SP)
c++
、
c
、
visual-studio
、
cuda
、
gpgpu
我是一个刚刚开始
CUDA
程序的人。现在还不知道SP是否是SM中
的
任何项。我认为项目"(14)多处理器,(8)
CUDA
核心/ MP“,这是正确
的
SP和SM,但我将正确理解以下几点?
CUDA
设备</e
浏览 0
提问于2013-10-17
得票数 5
1
回答
Ubuntu18.04.1-
Cuda
10.1安装,将nvidia驱动程序更新为455,与tensorflow不兼容,
drivers
、
apt
、
nvidia
、
cuda
、
tensorflow
下面是我用于安装
cuda
10-1
的
步骤去除"cublas“"
cuda
*”"nsight*“sudo apt-自动删除sudoapt-
获取
自动清洗sudo rm -rf /usr/local/
cuda
*在此之后,我按照tensorflow页面上
的
说明进行操作。-450
数
多apt-
获取</
浏览 0
提问于2020-10-07
得票数 2
1
回答
如何
在
Cuda
内核上启用RT
核
?
cuda
通过阅读,我了解到GeForce RTX模型有RT
核
和张量
核
。我
的
问题是,在我
的
code代码中使用了哪些核心?我能控制它吗? 我有一个射线追踪内核,想从RT内核中受益吗?RT核心是默认使用
的
,还是有一个标志来启用它?
浏览 1
提问于2020-10-16
得票数 1
回答已采纳
1
回答
CUDA
主机到
设备
的
传输比
设备
到主机
的
传输更快
cuda
我正在做一个简单
的
cuda
程序,在这个程序中,我发现90%
的
时间来自于一个单一
的
语句,这是一个从
设备
到主机
的
cudamemcpy。该程序在600-700微秒内将大约2MB
的
数据从主机传输到
设备
,并在10ms内将4MB
的
数据从
设备
复制回主机。我
的
程序总共花费了13ms
的
时间。我
的
问题是,为什么在
设备
到主机和主机到
设备
的</
浏览 3
提问于2012-07-15
得票数 4
2
回答
显示驱动程序本身使用了哪些
CUDA
资源?
cuda
、
nvidia
根据该规范,该卡有15个流多处理器(SM),每个处理器有32个
CUDA
核
。 我
的
代码使用N块,每个块有32个
核
。理想情况下,如果是N <= 15,我预计,由于每个块可以分配给不同
的
SM,每个块
的
运行速度与单个块一样快。对于'N > 15',当各块开始共享SMs时,每个块
的
性能都会下降。这也几乎是我在实践中观察到
的
:每个单独块
的
性能从N = 12开始下降,性能在N = 57时停滞,也就是说,好像有三个额外
浏览 3
提问于2012-05-07
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
详解英伟达芯片在自动驾驶的软件移植设计开发
训练提速60%!只需5行代码,PyTorch 1.6即将原生支持自动混合精度训练
TensorFlow 1.5 中的扩展卷积支持
GPU加速的计算机视觉学习资源下载
论文复现前奏篇:漫漫长路之Caffe-C3D
热门
标签
更多标签
活动推荐
运营活动
广告
关闭
领券