腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
CUDA
我
的
共享
内存
代码
不
工作
,
我
遗
漏了
什么
?
我
正在尝试实现动态
共享
内存
,但它不起作用。请检查
代码
并告诉
我
我
遗
漏了
什么
-问题似乎与gpu_configuration ()有关。 下面是一个基本
的
动态
共享
内存
代码
。
我
已经将其与https://github.com/NVIDIA-developer-blog/code-samples/blob/maste
浏览 17
提问于2019-07-02
得票数 1
回答已采纳
1
回答
内核启动时出现"invalid device error“错误
、
我
正在尝试从多个OpenMP线程使用多个
CUDA
设备。设备从主线程初始化(即在设备上分配
内存
),然后
我
从不同
的
线程使用cudaSetDevice在不同
的
设备上启动内核。线程
不
共享
设备,每个线程对其设备具有独占访问权限。 据我所知,这应该可以很好地
工作
。然而,当我从一个非主线程(即omp_get_thread_num() != 0)
的
CUDA
线程启动设备上
的
内核时,
我</em
浏览 2
提问于2012-10-26
得票数 0
回答已采纳
1
回答
GTX 970
的
CUDA
器件特性
、
、
打电话时
cuda
_error = cudaGetDevice(&device);
cuda
_error = cudaGetDeviceProperties(&prop, device);在GTX 970上
浏览 4
提问于2015-03-03
得票数 0
回答已采纳
1
回答
线程写入重叠时访问
CUDA
中
的
共享
内存
、
、
我
正在编写一个
CUDA
实现,为国际象棋引擎生成“神奇
的
比特板”。
我
有一个有效
的
CUDA
版本,但我正在尝试优化它。然而,
我
认为主要
的
问题是访问
内存
。下面的
代码
部分确实返回了一个神奇
的
数字,但它是不正确
的
。
我
有一个不同
的
版本,每个线程生成自己
的
编号并检查每个索引本身,但这似乎不是
CUDA
的
方法。编
浏览 3
提问于2014-05-19
得票数 0
回答已采纳
1
回答
“无效设备序号”(cudaErrorInvalidDevice)返回cudaIpcOpenMemHandle
当我试图打开IPC
内存
句柄时,我会得到cudaErrorInvalidDevice,但我不知道为
什么
。
我
在CentOS 6.6上使用四种CentOS。handle_
cuda
_error(cudaSetDevice(device_id)); handle_
cuda
_error(cudaIpcGetMemHandle(&my_ipcmemhandle, (void *
浏览 6
提问于2015-08-19
得票数 1
回答已采纳
2
回答
Graphics.Polygon
代码
不
工作
-
我
遗
漏了
什么
?
、
、
、
我
的
小
代码
创建现代艺术到全屏幕大小
的
形式画布与不同
的
形状。
我
可以使椭圆,矩形和直线
工作
,但不是多边形。有人能帮我吗?(版本: Delphi社区版) uses ....
浏览 27
提问于2020-05-11
得票数 1
1
回答
cuda
并行还原#6
工作
,还原#7失败
、
、
我
使用这个
代码
来减少: #define blocksize 1024#define size blocksize*gridsize###################
浏览 1
提问于2018-07-28
得票数 0
回答已采纳
1
回答
在
Cuda
中使用最大
共享
内存
我
不能使用超过48K
的
共享
内存
(在V100上,
Cuda
10.2)cudaFuncSetAttribute(my_kernel, cudaFuncAttributePreferredSharedMemoryCarveout
我
在my_kernel中使用启动边界和动态
共享
内存
。my_kernel<<<grd, blk, 64 * 1024, my_stream>&
浏览 1
提问于2020-09-05
得票数 2
回答已采纳
1
回答
在
CUDA
Fortran中确定
共享
内存
使用情况
、
我
一直在写一些基本
的
CUDA
Fortran
代码
。
我
希望能够确定
我
的
程序使用
的
每个线程块
的
共享
内存
量(用于占用率计算)。
我
一直在用-Mcuda=ptxinfo编译,希望能找到这些信息。如果
我
删除了shared属性,那么我会得到 ptxas信息: device_procedures_main_kernel_
的
函数属性432字节堆栈帧,1124字节溢
浏览 1
提问于2014-11-27
得票数 0
4
回答
将for循环放入
CUDA
内核
、
、
或者这是一件很常见
的
事情吗?
浏览 0
提问于2011-08-11
得票数 9
回答已采纳
2
回答
不理解与_shared_
内存
中
的
结构数组相关
的
cuda
中
的
此警告
我
的
代码
运行良好,但我不明白这个警告。struct facet_
cuda
{IS_Vector_
cuda
normal;IS_Vector_
cuda
是一个具有默认构造函数
的</
浏览 2
提问于2013-11-27
得票数 2
回答已采纳
1
回答
非确定性输出
的
CUDA
调试过程
、
、
、
我
正在
我
的
Ubuntu 10.10 64位系统上调试
我
的
基于
CUDA
4.0/推力
的
图像重建
代码
,
我
一直在尝试找出如何调试这个运行时错误,其中
我
的
输出图像显示为一些随机
的
“噪声”。在
我
的
代码
中没有随机数生成器输出,所以我希望每次运行
的
输出都是一致
的
,即使它是错误
的
。
浏览 0
提问于2011-07-21
得票数 4
回答已采纳
1
回答
cuda
4.0如何支持递归
我
想知道,
cuda
4.0是否支持使用本地
内存
或
共享
内存
的
递归?
我
必须自己使用全局
内存
来维护堆栈,因为系统级别的递归不能支持
我
的
程序(可能是太多级别的递归)。当递归变得更深时,线程就停止
工作
。所以我真的想知道在
CUDA
中默认
的
递归是如何
工作
的
,它是否使用
共享
内存
的
本地
浏览 2
提问于2013-09-25
得票数 4
2
回答
通过归约计算
CUDA
中位数
、
我
可能正在做一些非常愚蠢
的
事情,但我似乎不能让这种简化
工作
(可能已经有一个库这样做了,但这是为了自学,所以请容忍
我
)。
我
正在尝试通过采用中位数方法来查找整数条目数组
的
中位数,
我
已经编写了以下
代码
: extern: gpuMedOdd<<<9, numEntries / 9>>>(d_ent
浏览 21
提问于2013-03-02
得票数 1
回答已采纳
1
回答
我
可以使用Numba
共享
内存
来加速Cupy吗?
、
、
、
、
macroscopic(fin,u,v): 这是
我
的
代码
的
一部分0], 上一个是常量数组v
的
定义def macroscopic(fin,=
cuda
.threadIdx.x ty
浏览 15
提问于2020-05-26
得票数 1
1
回答
库达: cudaMallocManaged处理出口吗?
、
如果(在C++ +
CUDA
中) cudaMallocManaged()用于在主机和GPU
内存
中分配
共享
数组,而程序遇到(例如在主机
代码
中)一个exit(1),这是否会永久地在GPU中留下悬空
内存
?
我
猜答案是
不
基于
的
,但我不确定GPU是否有某种回收机制。
浏览 2
提问于2018-10-04
得票数 0
回答已采纳
1
回答
将
CUDA
或OpenCL编译为llvm IR
、
、
、
Clang可以将
CUDA
(不完整)或OpenCL转换为llvm。它如何保留“
共享
”关键字,这样它才能知道
共享
内存
和全局
内存
之间
的
区别?
浏览 0
提问于2012-01-10
得票数 2
1
回答
需要动态分配超过硬件容量
的
共享
内存
的
CUDA
内核启动
、
据我所知,下面
代码
中
的
变量shared_mem_size是为每个块分配
的
共享
内存
量。但是,当总
共享
内存
大小(BLOCKS_GRID * shared_mem_size)超过硬件可用
共享
内存
的
总容量时,会发生
什么
情况呢?
浏览 1
提问于2013-11-06
得票数 0
回答已采纳
1
回答
库达活动翘曲与常驻翘曲
、
、
在
CUDA
中
的
占用定义为常驻
CUDA
翘曲与active one有
什么
区别?从
我
在web上
的
研究来看,似乎一个块在整个执行过程中都是驻留在SM上
的
(即与其寄存器/
共享
内存
文件一起分配
的
)。和“积极”有
什么
区别吗? 如果
我
有一个内核,它很少使用寄存器和
共享</
浏览 0
提问于2017-01-29
得票数 0
回答已采纳
1
回答
pycuda.debug实际上是做
什么
的
?
、
、
、
、
作为一个更大
的
项目的一部分,
我
遇到了一个奇怪
的
始终如一
的
bug,
我
无法理解它,但它是一个典型
的
“黑盒”bug;当使用
cuda
-gdb python -m pycuda.debug prog.py -args如果
我
放弃pycuda.debug,它就会崩溃。一致地,在多内核执行中
的
完全相同
的
点。 为了解释,
我
有(目前有三个)内核,用于不同
的
网格和块排列,以解决更大
的
优
浏览 0
提问于2011-04-25
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券