腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
记录所有系统记录的终端程序?
ram
、
cpu
、
monitor
、
log
、
gpu
我需要记录下
GPU
GPU
vRAM同时在一个系统上使用一个非GUI程序,这样我以后可以分析.我该怎么做? 我有一个Nvidia K40
GPU
浏览 0
提问于2017-09-27
得票数 0
1
回答
CPU->
GPU
传输与
GPU
->CPU传输
gpu
、
cpu
、
transfer
我一直在做一些实验,测量从CPU->
GPU
和
GPU
->CPU传输数据的延迟。我发现对于特定的消息大小,CPU->
GPU
的数据传输速率几乎是
GPU
->CPU传输速率的两倍。
浏览 3
提问于2012-10-23
得票数 2
2
回答
我们什么时候应该使用LAYER_TYPE_HARDWARE
android
、
opengl-es
在上阅读之后,我对3种不同类型的分层技术的理解是(假设设备有
GPU
) LAYER_TYPE_NONE -
GPU
将直接在屏幕上绘图.LAYER_TYPE_HARDWARE -绘图由
GPU
在
GPU
的屏幕外位图
存储器
上执行.
GPU
的屏幕外位图将由
GPU
呈现到屏幕
浏览 4
提问于2014-11-26
得票数 14
2
回答
Jetson Tegra TX1共享内存
cuda
、
tegra
我的问题是: CPU和
GPU
共享内存吗?或者是在
GPU
中的不同块之间共享的
存储器
。
浏览 5
提问于2016-06-30
得票数 2
1
回答
使用Nvidia
GPU
节点在Kubernetes上运行一个例子
tensorflow
、
kubernetes
、
nvidia-docker
我正在尝试用Nvidia
GPU
节点/奴隶来设置Kubernetes。我遵循了的指南,并且能够让节点加入集群。我尝试了下面的kubeadm示例pod:kind: Pod name:
gpu
-pod containers: extendedResources: resources: nvid
浏览 3
提问于2018-08-07
得票数 1
回答已采纳
1
回答
在现代x86硬件上用OpenCL或其他
GPU
框架实现CPU与
GPU
之间的数据共享
opencl
、
gpgpu
随着CPU和
GPU
硬件的不断统一,AMD与hUMA (异构统一
存储器
访问)和英特尔第四代CPU的统一应该允许CPU和
GPU
之间的数据共享。我想知道,最近的OpenCL (或其他
GPU
框架)实现是否允许运行在CPU和
GPU
上的代码之间真正的无副本共享(不显式或隐式数据复制)大数据结构。
浏览 2
提问于2014-04-30
得票数 5
回答已采纳
1
回答
OpenCL数据传输和直接
存储器
存取
opencl
、
gpu
、
amd-processor
AMD应用程序编程指南中写道(p.no 4-15): 对于传输DMA :对于从主机到设备的传输,数据由<=32复制到运行时固定的主机
存储器
缓冲区,并且kB引擎将数据传输到设备
存储器
。上述是DMA、CPU DMA引擎还是
GPU
DMA引擎?
浏览 1
提问于2012-10-06
得票数 4
20
回答
如何获取
GPU
的信息?
command-line
、
graphics
、
gpu
我正在寻找一个命令,它能给我提供与以下信息相同的信息:除了
GPU
(芯片和
存储器
的类型,频率)。
浏览 0
提问于2010-10-09
得票数 351
回答已采纳
2
回答
设备是否有寄存器?
hardware
、
device
、
cpu
、
processor
、
cpu-registers
我总是听说寄存器是CPU registers。其他设备或硬件是否也有自己的寄存器,如解码器硬件、显示设备、DMA控制器?
浏览 1
提问于2012-08-30
得票数 0
回答已采纳
3
回答
可编程CPU缓存?
caching
、
cpu
我实验室的CPU有大量的L3缓存(至强E5),nvidia的
GPU
有可管理的共享内存/缓存,并且有相当多的技巧可以通过这种可编程的缓存来提高性能,有没有办法对CPU的巨大缓存做同样的事情?
浏览 1
提问于2012-11-05
得票数 2
1
回答
蓝宝石Radeon HD 4870 2GB Vapor-X哈希率
mining
我想学习蓝宝石Radeon HD 4870 2GB的Vapor-X哈希,但没有信息在anywhere.How,我可以了解
gpu
的哈希率吗?以下是我们从核心时钟或内存时钟中学习到的
gpu
.Can的一些信息??我想使用
gpu
卡进行挖掘。蓝宝石Radeon HD 4870 2GB蒸气-X 制造商:蓝宝石核心时钟:750兆赫内存时钟:3,600兆赫(有效)
存储器
: 2GB GDDR5
浏览 0
提问于2017-11-08
得票数 0
2
回答
主机如何在汇编级将OpenCL内核和参数发送到图形处理器?
opencl
、
gpu
现在,主机程序如何告诉
GPU
要运行的指令。例如,我用的是Radeon Pro 460的2017 MBP。在汇编级,在主机进程中调用哪些指令来告诉
GPU
“这就是您要运行的内容”。我是一名工具链工程师,我对
GPU
编程的工具链方面很好奇,但我发现很难找到好的资源。
浏览 2
提问于2018-08-26
得票数 1
1
回答
来自缓冲区优化的python映像流
python
、
flask
、
optimization
、
video-streaming
我正在一个计算能力有限的嵌入式设备上开发Python +烧瓶。下面是我已经做过的当前优化: from PIL import Image def stream(): yield b"--frame\r\n"
浏览 2
提问于2022-06-30
得票数 1
1
回答
Python -
GPU
工作时将数据从
存储器
传输到RAM
python
在训练神经网络时,特别是在处理高分辨率图像时,需要从
存储器
中加载图像(SSD/HDD),并将其加载到RAM中,然后输入
GPU
进行训练。有很多时候,
GPU
在CPU非常空闲的时候做所有的工作,所以我在想,在
GPU
工作的时候,有没有办法将下一批图像加载到RAM?因为如果我没有弄错的话,现在发生的事情是CPU从存储中加载图像,将它们传输到
GPU
,
GPU
做好自己的工作,然后
GPU
必须等待CPU从存储中加载新的映像。当
GPU
工作时,我们如何编码一个将检索
浏览 1
提问于2017-11-20
得票数 2
回答已采纳
1
回答
GPU
存储器
读取指令流程操作数收集器
gpu
、
gpgpu
、
nvidia
我正在尝试学习
GPU
与
GPU
的体系结构,我对内存操作的流程感到困惑。假设我有a=b+ c这样的算术指令。在进行计算之前,需要对b和c进行内存加载操作。在失败的情况下,请求被添加到MSHR并通过
gpu
核互连网络发送到较低的
存储器
。当请求从互连网络返回到核心时,它被添加到某种
存储器
响应fifo中。然后,通过从响应fifo中弹出这些请求来填充缓存行。
浏览 3
提问于2016-04-15
得票数 1
回答已采纳
1
回答
OpenCL全局内存与图像内存在Nvidia和AMD上的性能差异
opencl
OpenCL基准测试站点提供了以下基准测试Image Filter: Separable Gaussian Blur - Image Memory Usage我问的原因是我在我的GTX 590上写了一个光线跟踪器,它运行得非常快。从大多数评论中,我预计我的光线追踪器在HD7
浏览 0
提问于2013-03-10
得票数 2
2
回答
CUDA表面
存储器
的峰值带宽?
cuda
、
gpu
、
benchmarking
、
nvidia
表面
存储器
是CUDA中纹理缓存的唯一模拟. 如果不是,那么我如何实现一个基准来测量写入表面内存的带宽呢?
浏览 5
提问于2013-01-17
得票数 1
1
回答
我可以在GPUDirect 2.0 P2P的远程
GPU
上使用CUDA原子操作吗?
cuda
、
nvidia
、
gpgpu
、
multi-gpu
、
gpudirect
例如,我可以使用CUDA原子操作atomicAdd(ptr, val),atomicCAS(ptr, old, new),.它的全局
存储器
(
GPU
)。与数据自动化系统6.5。
浏览 6
提问于2015-01-18
得票数 2
回答已采纳
1
回答
您可以用CU_STREAM_WAIT_VALUE_FLUSH等待什么“远程写入”?
memory
、
cuda
、
synchronization
、
cuda-driver
当您使用CUDA驱动程序API调用cuStreamWaitValue32()执行等待值操作时,可以指定标志CU_STREAM_WAIT_VALUE_FLUSH。下面是文档所做的工作:
浏览 6
提问于2020-08-20
得票数 1
1
回答
我在VRAM上存储的数据比实际大小还要多。那件事怎么可能?
opengl
、
memory
、
gpu
、
vbo
我在分析我的简单体素化世界渲染器的性能。我想找出一种不同的技术,一种压力测试的性能极限。有一天我发现了一些很棒的东西。我用不同的VBO为每个块分配几何数据。我正在使用一些计数器编程到引擎中,帮助我了解数据发生了什么变化。每个vert包括3个浮动的位置,3个浮动的法线向量和4个浮动的RGBA颜色。浮点数显然是4个字节的大小,因此我计算出整个世界的估计内存大小大约为1098 of (顶点计数*3* 4* 2+ vertexcount *4* 4)。 我以惊人的速度运行7 FPS的程序,但它的工
浏览 0
提问于2014-09-10
得票数 3
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
“会思考的”存储器:三星推出高带宽存储器-PIM
2018 存储器市场展望
存储器市场迎来拐点
ram存储器基本概念
python爬虫初探:数据存储器
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券