腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
默认固定内存与零拷贝内存
cuda
在CUDA中,与
主机
上通过malloc分配的默认内存相比,我们可以使用固定内存更有效地将数据从
主机
复制到
GPU
。但是,有两种类型的固定内存:默认固定内存和零拷贝固定内存。默认的固定内存将数据从
主机
复制到
GPU
的速度是正常传输速度的两倍,因此绝对有一个
优势
(只要我们有足够的
主机
内存来锁定页面)。在不同版本的固定内存中,即零拷贝内存中,我们不需要将数据从
主机
完全复制到
GPU
的DRAM。内核直接从
主机
内存读取数据。 我的问
浏览 7
提问于2011-03-06
得票数 41
回答已采纳
1
回答
CUDA共享内存中的扁平与多维数组
cuda
与库达共享内存中的多维数组相比,使用扁平数组有什么性能
优势
吗? 我知道,当涉及到
主机
内存空间时,扁平数组比多维数组提供了某些
优势
,但我不确定这是否适用于
gpu
共享内存中的数组。
浏览 2
提问于2015-07-20
得票数 0
回答已采纳
1
回答
启动android模拟器时出错: FB::flushWindowSurfaceColorBuffer:找不到窗口句柄0x4
android
、
android-emulator
我刚刚开始使用android。因此,当我尝试启动AVD (详细信息如下)时,它不会启动,只是有一段时间是黑屏,直到我厌倦它并关闭它。我已经安装了intelhaxm,并禁用了hyper-v。[2014-07-28 20:02:52 - app2] ------------------------------[2014-07-28 20:02:52 - app2] adb is running normally. [2014-07-28 20:02:52 - app2] Per
浏览 89
提问于2014-07-29
得票数 20
回答已采纳
1
回答
Cuda内存分配
image-processing
、
memory-management
、
cuda
、
nvidia-jetson
为此,我使用
GPU
。使用jetson,我们可以避免
主机
/设备和设备/
主机
之间的数据传输,因为TX2是在
GPU
和CPU之间共享内存的。此方法有效,但它太长了: img[i] = buffer[i] ; 我失去了
GPU
使用naive for循环的
优势
...如果我只是使用这个方法
浏览 1
提问于2020-03-31
得票数 0
1
回答
如何改进氪星以对抗
GPU
的开采
sha-256
、
scrypt
我知道氪星的设计是为了减少
GPU
/ASIC的
优势
。 我们现在有莱特奥作为这方面的一个现实世界的例子。然而,它的效果并不完美。大多数硬币都是由
GPU
开采的,尽管
优势
可能比SHA-256的
优势
要小。
浏览 0
提问于2013-04-17
得票数 8
回答已采纳
5
回答
CUDA零拷贝内存注意事项
c++
、
cuda
我正在尝试运行一个内核,其中我的输入数据超过了
GPU
上可用的数量。"h_p")populate 分配固定
主机
内存(我们称它为带有输入数据的get设备指针,在
GPU
上为h_p 运行内核,使用该设备指针来修改数组的内容如果这是正确的,那么我可以看到内核的
浏览 5
提问于2011-02-15
得票数 8
1
回答
CUDA浮点精度与CPU实现不匹配
cuda
、
precision
上使用CUDA 5.5 compute 3.5,并想计算以下公式: Y=a*a*b/ 64 +c*c 假设我有以下参数: a = 5876c = 664 我通过
GPU
当我将它们插入到我的计算器中时,
GPU
的答案更接近于确切的答案,我怀疑这与浮点精度有关。我现在的问题是,如何让CUDA解决方案与CPU版本的精度/舍入相匹配?
浏览 90
提问于2020-11-09
得票数 0
回答已采纳
1
回答
MATLAB代码的code实现
matlab
、
cuda
、
mex
、
ptx
我最近购买了一个gpuarrays
GPU
,希望能加快并行代码的速度,并需要一些帮助来决定如何将MATLAB代码转换为CUDA代码(我已经从MATLAB中的普通P100移开了)。
浏览 5
提问于2017-07-17
得票数 0
1
回答
CUDA信号到
主机
c++
、
cuda
是否有方法在内核执行结束时向
主机
发出信号(成功/失败)?在每次迭代结束时复制单个布尔变量将使通过并行化获得的时间增益无效。因此,我想找到一种方法,让
主机
知道收敛状态(成功/失败),而不必每次都要CudaMemCpy。注意:使用固定内存传输数据后存在时间问题。 我看过的替代方案。使用CudaHostAllocMapped来避免CudaMemCpy,这是没有
浏览 1
提问于2018-01-04
得票数 3
回答已采纳
1
回答
OpenCL -提高内存大小的使用
2d
、
opencl
、
dimensions
、
large-data
因为我想放更多的数据,输出将是481 x 283大,我将达到
GPU
的内存限制。我不知道怎么少用点内存。
浏览 2
提问于2016-06-08
得票数 0
2
回答
比较CPU和
GPU
中内存范围的标准方法是什么?
cuda
、
gpu
、
equality
、
thrust
我必须连续范围(指针+大小),一个在
GPU
和一个在CPU中,我想比较它们是否相等。my_
gpu
_type
gpu
; //
gpu
.data() returns thrust::cuda::pointer<double> thrust::equal(cpu.data(), cpu.data() + cpu.size(),
gpu</em
浏览 19
提问于2022-03-17
得票数 0
回答已采纳
1
回答
什么是
GPU
实例,它与标准实例有什么不同?
performance
、
gpu
、
instancing
我已经读到了很多关于团结5.4中的新特性的辩论:
GPU
实例。我理解在一般情况下的重要性,无论是在节省内存和吸引电话方面。然而,即使在阅读了一些之后,我仍然无法理解
GPU
实例和非
GPU
实例之间究竟有什么不同,更重要的是,所谓的
GPU
在性能方面的
优势
来自哪里。 谢谢你的知识和任何参考资料。
浏览 0
提问于2016-05-29
得票数 1
回答已采纳
1
回答
Tensorflow:单
GPU
与多
GPU
tensorflow
、
gpu
与拥有两个更小的
GPU
相比,拥有一个具有更多内存的
GPU
有什么
优势
?
浏览 20
提问于2017-02-08
得票数 1
1
回答
Theano对局域网上多
GPU
的支持
neural-network
、
gpu
、
theano
我想知道theano是否可以用来在局域网上分布在多台计算机上的多
GPU
架构上训练神经网络。 我已经通过Theano的文档了解到,它可以在一台计算机上支持多个
GPU
,但我想知道它如何扩展到can。
浏览 18
提问于2016-09-13
得票数 0
2
回答
使用Sun Grid引擎(SGE)调度
GPU
资源
gpu
、
gpgpu
、
sungridengine
、
multiple-gpu
我们有一组机器,每台都有4个
GPU
。每个作业应该能够要求1-4个
GPU
。这里有一个问题:我想让SGE告诉每个工作,它应该采取的
GPU
(s)。与CPU不同的是,如果一次只有一个进程访问
GPU
,则
GPU
的工作效果最好。所以我想:Job #2
GPU
: 2我遇到的问题是,SGE将允许我在每个节点上创建一个包含4个单元的
GPU
资源
浏览 6
提问于2012-05-11
得票数 4
回答已采纳
2
回答
GPU
实例与标准实例有什么不同?
gpu
、
performance
我已经阅读了很多关于一个新特性的辩论,这个新特性将在游戏引擎Unitor5.4的新版本中提供,称为
GPU
实例。我理解在一般情况下的重要性,无论是在节省内存和吸引电话方面。然而,即使在阅读了一些之后,我仍然无法理解
GPU
实例和非
GPU
实例之间究竟有什么不同,更重要的是,与标准实例相比,所谓的
GPU
在性能方面的
优势
来自哪里。 谢谢你的知识和任何参考资料。
浏览 0
提问于2016-06-09
得票数 3
1
回答
Matlab - CPU工作者或
GPU
处理器中的高度并行任务
matlab
、
parallel-processing
、
gpu
workerData = data(:,ix);enddataGPU = gpuArray(data);(实际上,我正在执行一个似然计算,它使用Workers中的for循环在列向量上的
浏览 5
提问于2013-08-05
得票数 1
1
回答
有可能有不同的开发虚拟机环境和访问图形卡吗?
virtual-machine
、
virtualbox
、
virtualization
、
hypervisor
测试应用程序的环境 首先,我使用VirtualBox为#1和#2在我的
主机
Windows中创建了VM环境,但是我不能在VM中运行,因为它不提供对图形卡的访问。
浏览 1
提问于2021-01-12
得票数 0
1
回答
不使用第二次
GPU
将AMD
GPU
传送到虚拟机
gpu
、
virtualization
我阅读了一些关于将
GPU
传递到虚拟机的主题,但这些示例需要两个
GPU
(一个用于VM,一个用于
主机
操作系统)。现在,我发现有人提到将系统
GPU
中可用的单个文件传递给VM。这在Ubuntu有可能吗?
浏览 0
提问于2015-03-11
得票数 1
1
回答
如何在两个
GPU
之间直接复制cudaArray?
memory-management
、
cuda
、
gpu
假设我在
GPU
1中有一个
GPU
1,在
GPU
2中有另一个cudaArray。使用cudaMemcpyArrayToArray标志调用cudaMemcpyDeviceToDevice实际上会导致
GPU
1 cudaArray通过查看分析器复制到
主机
内存和复制到
GPU
2 cudaArray的
主机
内存。我尝试将
GPU
1 cudaArray复制到
GPU
1全局内存,并调用cudaMemcpyPeer将其复制到
GPU
2全局内存,然后
浏览 6
提问于2016-02-09
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
云主机优势是什么?
什么是虚拟主机,虚拟主机的优势有哪些?
诚云电脑优势之维护主机
网站建设用云主机的最佳优势
独立IP虚拟主机是什么?独立IP虚拟主机建站有什么优势?
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券