Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >在Cuda中使用最大共享内存

在Cuda中使用最大共享内存
EN

Stack Overflow用户
提问于 2020-09-05 10:29:13
回答 1查看 2.6K关注 0票数 2

我不能使用超过48K的共享内存(在V100上,Cuda10.2)

我打电话

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cudaFuncSetAttribute(my_kernel,
                     cudaFuncAttributePreferredSharedMemoryCarveout,
                     cudaSharedmemCarveoutMaxShared);

在第一次启动my_kernel之前。

我在my_kernel中使用启动边界和动态共享内存。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
__global__
void __launch_bounds__(768, 1)
my_kernel(...)
{
    extern __shared__ float2 sh[];
    ...
}

内核的名称如下所示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
dim3 blk(32, 24); // 768 threads as in launch_bounds.

my_kernel<<<grd, blk, 64 * 1024, my_stream>>>( ... );

内核调用后的cudaGetLastError()返回cudaErrorInvalidValue

如果我使用共享内存的<= 48K(例如,my_kernel<<<grd, blk, 48 * 1024, my_stream>>>),它就能工作。

汇编标志是:

nvcc -std=c++14 -gencode arch=compute_70,code=sm_70 -Xptxas -v,-dlcm=cg

我遗漏了什么?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-09-05 13:10:06

来自这里

计算能力7.x设备允许一个线程块来处理共享内存的全部容量: Volta为96 KB,图灵为64 KB。依赖于每个块超过48 KB的共享内存分配的内核是特定于体系结构的,因此它们必须使用动态共享内存(而不是静态大小的数组),并且需要显式地选择使用cudaFuncSetAttribute(),如下所示:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
cudaFuncSetAttribute(my_kernel, cudaFuncAttributeMaxDynamicSharedMemorySize, 98304);

当我将这一行添加到您显示的代码中时,无效的值错误就会消失。对于图灵设备,您可能希望将该数字从98304更改为65536。当然,65536对你的例子也是足够的,虽然不足以使用伏尔塔上的最大值,如问题标题中所述。

在安培上的类似时尚内核中,安培设备应该能够使用多达160 be的共享内存(cc 8.0)或100 be (cc 8.6),使用上述选择机制动态分配,将数字98304更改为163840 (例如cc 8.0 )或102400 be( cc 8.6)。

请注意,以上内容涵盖了Volta (7.0)、图灵(7.5)和安培(8.x)两种情况。在7.x之前具有计算能力的GPU没有能力处理每个线程块超过48 to的地址。在某些情况下,这些GPU可能每个多处理器都有更多共享内存,但这是为了允许在某些线程块配置中占用更多内存。程序员没有能力使用超过48 no的每个线程块。

虽然它不涉及这里提供的代码(它已经在使用动态共享内存分配),但摘录的文档引用中的注释指出,在支持它的设备上使用超过48 to的共享内存需要2件事:

  1. 上文已经描述的选择加入机制。
  2. 内核代码中的动态共享内存( 分配 ),而不是静态共享内存。

动态示例:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
extern __shared__ int shared_mem[];

静态示例:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
__shared__ int shared_mem[1024];

动态分配的共享内存还需要在内核启动配置参数中传递一个大小(问题中给出了一个示例)。

票数 11
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63757245

复制
相关文章
现代脚本的加载
原文地址: Modern Script Loading, 文章作者是Preact作者Jason Miller
_sx_
2019/08/07
8700
Js脚本的异步加载
在浏览器中网页加载中 javascript 的 加载 和 执行会默认阻塞 DOM 的加载和页面的渲染。 因此,在编写代码的时候我们往往将 script 标签放到 body 的最后面。 当然,也可以通过异步创建 script 标签的方式来实现 js的异步加载。
epoos
2022/06/06
9.1K0
Js脚本的异步加载
无阻塞加载脚本
通常加载页面的时候,对于组件是并行下载的,现代大部分浏览器对于Js同样也是支持并行下载,但是在脚本下载、解析并执行完毕之前,不会开始下载任何其他内容。
菜的黑人牙膏
2019/01/21
4360
gdb加载python脚本的方法
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/xuzhina/article/details/76733977
血狼debugeeker
2018/09/20
2K0
智能图像签名生成脚本
https://cloud.tencent.com/document/product/867/17719
杜志强
2019/03/21
9300
Cycript 小知识:加载自己的脚本
Cycript是一个理解Objective-C语法的javascript解释器,这意味着我们能够在一个命令中用Objective-C或者javascript,甚至2者兼用。它能够挂钩正在运行的进程,能够在运行时修改应用的很多东西。
公众号iOS逆向
2022/08/22
6000
安装java脚本
卸载掉现有的JAVA版本的话,可以使用 rpm -qa | grep java 和 rpm -e xxx --nodeps进行卸载
summerking
2022/10/27
5040
java 脚本引擎
本文节选自《Netkiller Java 手札》 第 18 章 java 脚本引擎 目录 18.1. Maven 18.2. Helloworld 18.3. 运行脚本文件 18.4. 变量传递 18.5. 全局变量与局部变量定义 18.6. 调用脚本中的函数或方法 18.7. 脚本编译 什么是脚本引擎,脚本引擎是指在程序运行期间嵌入另一种脚本语言,并与其交互,产生最终运行结果 脚本引擎存在的意义是什么?脚本引擎可以改变编译语言的内部运行逻辑,弥补编译语言的不足,使编译语言具备动态语言的一部分特性。 是否有
netkiller old
2018/03/05
1.8K0
JavaScript 动态加载脚本和样式
3大点: 1.元素位置 2.动态脚本 3.动态样式 一.元素位置 getBoundingClientRect()。这个方法返回一个矩形对象,包含四个属性:left、top、right和bottom。分别表示元素各边与页面上边和左边的距离。 var box = document.getElementById('box');//获取元素 alert(box.getBoundingClientRect().top);//元素上边距离页面上边的距离 alert(box.getBoundingClientRect()
汤高
2018/01/11
1.4K0
Java动态脚本
诸如此类的需求若采用硬编码实现,则迭代成本相当高,每次改动都需要进行开发、测试、部署。同时业务规则的频繁变更会导致代码的开发和维护成本大大提高。
ruochen
2021/11/22
1K0
Java中ImageIcon的路径问题
这行代码执行时在project目录下查找名为logo.gif的文件,结果当然是找不到。
緣來
2020/01/02
2.9K0
异步加载脚本保持执行顺序
首先是外部脚本和行内脚本,对于异步加载的脚本,会导致竞争状态,使得出现未定义的错。
菜的黑人牙膏
2019/01/21
1.8K0
Quick-Task 动态脚本支持框架之Groovy脚本加载执行
上一篇简答说了如何判断有任务动态添加、删除或更新,归于一点就是监听文件的变化,判断目录下的Groovy文件是否有新增删除和改变,从而判定是否有任务的变更;
一灰灰blog
2018/08/07
1.2K0
Quick-Task 动态脚本支持框架之Groovy脚本加载执行
用shell脚本猜大小
创建shell脚本环境 vim guess 极简猜大小 echo $1 if [ $1 -gt 12 ]; then echo "猜大了" elif [ $1 -lt 12 ]; then echo "猜小了" else echo "猜对了" break fi 用while语句 猜大小 while true; do echo "请输入一个数字" read aa; if [ $aa -gt 12 ]; then echo "
Maynor
2021/04/09
2740
用Python写Shell脚本
os.system函数与系统编程中的exec族函数调用一致,创建出子进程后代码段由外部程序替换,不会返回外部程序运行结果。
菜菜cc
2022/11/15
1.5K0
Java动态脚本运用
一般的需求可使用上述动态脚本实现,如果遇到业务规则更为复杂、规模更大、对功能和性能有更高要求的需求时,可考虑更为专业的规则引擎和计算/表达式引擎。
花落花相惜
2021/12/15
1.3K0
JAVA调用Shell脚本
在实际项目中,JAVA有时候需要调用C写出来的东西,除了JNI以外,我认为一种比较好的方法是JAVA调用Shell。先把C写出来的make成可执行文件,然后再写一个shell脚本执行该可执行文件,最后是JAVA调用该shell脚本。 JAVA调用很简单,例子如下: 首先是shell脚本 /users/bmcmsend_linux/server/bin/msend -n @10.26.202.27:1828#mc -a TRKUTIL_EV -v -j /users/bmcmsend_linux/server
Java学习123
2018/05/16
3.1K0
java: ant 脚本示例
1 <?xml version="1.0" encoding="UTF-8"?> 2 3 <!--basedir是从build.xml所在的目录为基础算起的--> 4 <project nam
菩提树下的杨过
2018/01/24
8660
180807-Quick-Task 动态脚本支持框架之Groovy脚本加载执行
上一篇简答说了如何判断有任务动态添加、删除或更新,归于一点就是监听文件的变化,判断目录下的Groovy文件是否有新增删除和改变,从而判定是否有任务的变更;
一灰灰blog
2019/05/26
5250
Java基础-脚本引擎
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
cwl_java
2019/11/12
9850

相似问题

SQL server“心跳”检查的最低权限?

33

弹性心跳响应检查TCP错误

12

REST心跳检查服务可用性

11

Api对Api Root执行心跳检查

22

弹性搜索+心跳-是否可以检查java应用程序是否正在运行?

116
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文