腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
共享
内存
和
全局
内存
,
是否
可以
使用
共享
作为
计算
的
中间
阶段
、
、
、
我看到了很多分别处理设备
内存
和
共享
内存
的
示例。我被卡住了,迷惑了。代码或函数
可以
同时处理这两种情况吗?例如,代码
可以
在某种规模上
使用
共享
内存
乘以数字,而在另一种规模上
使用
设备。另外,当我试图一步一步地使代码复杂化以
计算
适应度函数时,我
使用
共享
内存
的
空间
作为
中间
阶段</
浏览 20
提问于2020-09-03
得票数 0
1
回答
关于CUDA
内存
访问
的
简短问题
、
嘿,假设我有一个问题,每个线程都
计算
一些东西(从常量
内存
中读取一些参数并
使用
它们进行
计算
),然后将其存储到
全局
内存
矩阵中。这个矩阵永远不会被读取,只是写入访问...现在
是否
可以
先
使用
共享
内存
将所有
计算
值存储在
全局
内存
中,然后再将它们写入
全局
内存
?我认为不是,因为对
全局
内存
<e
浏览 3
提问于2011-05-17
得票数 0
回答已采纳
3
回答
CUDA:什么时候
使用
共享
内存
,什么时候依赖L1缓存?
、
、
在
计算
能力2.0 (Fermi)发布后,我想知道
是否
还有
共享
内存
的
用例。也就是说,什么时候
使用
共享
内存
比让L1在后台执行它
的
魔术更好呢?
共享
内存
只是为了让专为CC < 2.0设计
的
算法在不修改
的
情况下高效运行吗? 为了通过
共享
内存
进行协作,块中
的
线程写入
共享
内存
并与__
浏览 1
提问于2012-07-01
得票数 21
回答已采纳
1
回答
在具有虚拟
共享
内存
的
分布式系统中,实际
共享
物理RAM
的
是谁?(服务器
和
/或客户端)
有一家公司有大约100台电脑供员工
使用
,还有一台高性能
的
服务器.它被系统架构师称为“分布式系统”。它
使用
分布式
共享
内存
(DSM)。还有
中间
件,服务器托管虚拟机( Virtual,VM),运行员工看到
的
应用程序。 问题是: DSM来自服务器
共享
的
物理
内存
,创建虚拟
共享
内存
,还是
内存
来自这100台
计算
机(或两者兼而有之)?除了这里可能
的</e
浏览 0
提问于2019-09-30
得票数 0
回答已采纳
1
回答
朱莉娅Distributed.jl问题
、
、
我想
使用
pmap对运行在同一台机器上
的
多个处理器上
的
迭代器上
的
函数并行化,并在Julia集群中
共享
内存
,并想了解一些细节。@everywhere应用于函数
和
变量,包括数组、字典和数据格式,所有处理器都
可以
读取它。这是通
浏览 5
提问于2021-07-05
得票数 3
1
回答
如何
找出GPU
的
共享
内存
和
全局
内存
大小?
、
、
、
、
我想知道我
的
GPU
的
共享
内存
和
全局
内存
大小。我正在
使用
nvidia特斯拉k40c。我找到了,它说标准
内存
是12 GB。标准
内存
是否
与
全局
内存
相同?
如何
找到
共享
内存
的
大小?
是否
有显示gpu功能
的
命令?我
使用
了nvidia-smi命令,但它没有
浏览 4
提问于2016-06-26
得票数 3
回答已采纳
1
回答
在多处理器系统中,每个核心外
的
内存
总是在概念上是扁平
的
/统一
的
/同步
的
吗?
、
、
、
、
多处理器系统执行“真实”
内存
操作(那些影响确定性执行(而不仅仅是推测执行)
的
操作)无序
和
异步执行,因为等待
全局
状态
的
全局
同步几乎总是不必要地阻止所有执行。因此,在CPU上,在一个极端被定义为私有的“寄存器”,在另一个极端是
共享
的
内存
;在寄存器
的
极小空间之外,具有特殊
的
命名或寻址模式,
内存
始终是
全局
的
、
共享
的
<e
浏览 1
提问于2019-05-23
得票数 5
回答已采纳
1
回答
使用
共享
存储器对三维数组
的
一维求和
、
、
; ++x) { index++;我希望每个块都
计算
一个
和
,因为每个块都有自己
的
共享
内存
为了避免数据竞争,我
使用
了atomicAdd,如下所示:dim3 block (n, 1, 1);内核: atomicAddblockDim.y]
浏览 1
提问于2012-04-01
得票数 3
回答已采纳
1
回答
计算
阴影与Cuda之间
的
映射
、
、
、
、
我试图了解
计算
机阴影
和
库达之间
的
区别,以及它们是
如何
运作
的
。我只
使用
过库达,据我所知: 在基于着色器
的
计算
中,着色器
的
数量等于像素
的
数量,而在Cuda中,我们
可以
使用
内核线程操作多个‘像素-数据元素’。在中,我们有各种各样
的
内存
类型,我们
可以
从中获取数据(
全局
的
、
共享
浏览 2
提问于2014-01-10
得票数 0
3
回答
数据自动化系统
共享
的
记忆
和
全球记忆有什么不同?
、
、
、
我对
如何
在CUDA中
使用
共享
和
全局
内存
感到困惑,特别是在以下方面:
全局
内存
是否
驻留在主机或设备上?在
共享
内存
中存储变量
是否
与通过内核传递其地址相同?i_ptr);} int mai
浏览 8
提问于2012-12-30
得票数 43
回答已采纳
1
回答
块
的
数量
可以
同时调度。
这个问题也是从以下链接开始
的
:
是否
意味着当条件2
和
3
的
块数超过8时,只能调度8个块?它
是否
与任何条件无关,如cuda环境、gpu设备或算法?如果是的话,,这实际上意味着在某些情况下最好不要
使用
共享
内存
,这取决于此。然后,我们必须考虑
如何
判断哪个更好,
使用
还是不
使用
浏览 6
提问于2012-04-04
得票数 0
回答已采纳
1
回答
Unix系统是
如何
在进程fork()时跟踪
共享
内存
的
?
、
、
、
、
进程A创建
共享
内存
区域并与进程B
共享
它。然后进程A分叉并由此创建进程C。根据定义,C现在
可以
访问相同
的
共享
内存
区域。如果A死了,C
和
B仍然
可以
访问
内存
区域。只有当C
和
B也死亡时,物理
内存
才会再次释放。 Unix系统是
如何
实现这一点
的
?它们
是否
存储有关每个进程与谁
共享
哪个
内存
的
浏览 2
提问于2014-11-12
得票数 0
回答已采纳
1
回答
如何
将
全局
内存
中
的
读取与short或char类型
的
元素正确地合并为
共享
内存
(假设每个元素有一个线程)?
、
、
我正在编写一个CUDA内核函数,它将T类型数组从
全局
内存
读取到
共享
内存
中,进行一些
计算
,然后将T类型数组写回
全局
内存
。我
使用
共享
内存
,因为每个输出元素
的
计算
实际上不仅取决于相应
的
输入元素,还取决于附近
的
输入元素。我只想加载每个输入元素一次,因此我希望在
共享
内存
中缓存输入元素。我
的
计划是让每个线
浏览 0
提问于2012-01-20
得票数 3
回答已采纳
1
回答
OpenCL是
共享
、分布式还是混合存储系统
、
、
我很难理解OpenCL,特别是OpenCL 2.0+是一个
共享
的
,分布式
的
还是分布式
的
共享
内存
架构,特别是在一台电脑上有许多OpenCL设备
的
情况下。特别是,我
可以
看到它是一个
共享
内存
系统,因为它们都
可以
访问
全局
内存
,但它们
的
计算
单元具有类似网络
的
方面,这让我怀疑它
是否
可以
经
浏览 2
提问于2017-05-28
得票数 0
1
回答
除了__syncthreads()之外,
是否
有任何东西
可以
防止读后写入、内翘曲
共享
内存
的
危害?
、
、
、
我有一个偏差,它将一些数据写入
共享
内存
--没有覆盖,并且在从
共享
内存
读取之后不久。虽然我
的
块中可能有其他偏差,但它们不会触及
共享
内存
的
任何部分,也不会将我
的
兴趣偏差从任何地方写入。当块中
的
某些线程访问
共享
或
全局
内存
中相同
的
地址时,这些
内存
访问中可能存在读后写、写后读或写后写
的
危险。通过同步这些访问之间
的
浏览 3
提问于2017-04-20
得票数 1
回答已采纳
2
回答
将
共享
库映射到物理
内存
、
最近,我一直在读“
计算
机系统”。它说
共享
库
作为
进程之间
的
共享
对象映射到物理
内存
的
同一页,包括它
的
.data部分
和
.text部分。在一个进程中对
共享
对象
的
写操作也
可以
被另一个进程“
共享
”。问题是:在构建
共享
库时,数据部分以GOT开头,它包含
全局
变量
的
地址。动态加载器负责填充与
共享
库链接
的
浏览 2
提问于2018-11-05
得票数 1
1
回答
是否
值得通过
共享
内存
传递内核参数?
、
、
至于其他变量,我看到了一些例子,它们不需要分配
内存
就
可以
传递一个整数,直接传递给内核函数。在我
的
例子中,这样
的
变量是a、b
和
c。现在有个问题,我对CUDA有点陌生,我不确定
是否
有可能将变量a、b
和
c
的
内存
转移到每个块
的
共享
内存
中,而不让每个线程从
全局
内存
中读取这些变量并将它们加载到
共享
内存
中,因此最终
全
浏览 3
提问于2013-05-25
得票数 7
回答已采纳
1
回答
GPU中
的
L1缓存
、
、
在阅读GPU
的
内存
层次结构时,我看到了一些类似的术语,而且由于在过去
的
版本中有一些架构修改,我不知道它们
是否
可以
一起
使用
,或者有不同
的
含义。该设备是M2000,它是
计算
兼容性5.2。顶层(最接近管道)是一个统一
的
L1/纹理缓存,它是每SM 24 SM。指令和数据也是统一
的
吗? 下面是 L2 缓存,也称为
共享
内存
,根据.在deviceQuery或nvprof度量中都没有关于
浏览 1
提问于2019-04-18
得票数 2
回答已采纳
1
回答
持久GPU
共享
内存
、
、
、
我是CUDA编程
的
新手,由于性能原因,我主要
使用
每个块
的
共享
内存
。按照我现在
的
程序结构,我
使用
一个内核加载
共享
内存
,
使用
另一个内核读取预先加载
的
共享
内存
。但是,据我所知,
共享
内存
不能在两个不同
的
内核之间持久。第一个解决方案:我
使用
一个内核,
浏览 1
提问于2012-06-22
得票数 1
回答已采纳
1
回答
涉及多个进程
的
矩阵乘法
共享
内存
、
、
、
我正试图通过
共享
内存
来学习IPC。我不明白
如何
将
共享
内存
分配给不同processes.For示例中
的
各种变量,在矩阵乘法中,我不想
全局
声明矩阵,而是通过
共享
内存
声明矩阵。
如何
将
内存
附加到不同
的
矩阵,如: 有人能帮我吗?另外,它
是否
可以
被mmap()
和
shm_open()替换,或者仅仅是文件?如果是,怎么做?我找不到恰当
的
浏览 5
提问于2013-03-13
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券