腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(814)
视频
沙龙
1
回答
如何
有效地
将
数据
从
2D
主机
阵列
(
带
填充
)
复制到
1D
设备
阵列
,
并
删除
CUDA
中
的
原始
填充
?
、
我在
主机
上有一个
带
填充
的
2D
列主数组,例如: |2 5 8| |x x x|我想将
数据
作为一维数组
复制到
设备
内存
中
:或 {1, 2, 3, 4, 5,6, 7, 8,
浏览 4
提问于2020-05-07
得票数 0
回答已采纳
1
回答
cuda
:
如何
将
主机
数据
复制到
3D
cuda
阵列
并将其复制回来
、
、
"
cuda
c编程指南“给出了使用
cuda
数组
的
例子。这些示例仅限于
2D
。因此,在
2D
cuda
阵列
的
情况下,我
将
简单地执行以下操作,
将
主机
数据
复制到
设备
内存:&
浏览 0
提问于2012-06-29
得票数 2
回答已采纳
4
回答
使用相同__constant__内存
的
CUDA
主机
和
设备
我有使用常量内存
的
设备
/
主机
功能。它在
设备
上运行正常,但在
主机
上,该内存似乎仍未初始化。
如何
同时初始化
设备
和
主机
内存常量?
浏览 2
提问于2012-02-27
得票数 9
回答已采纳
1
回答
是否可以
将
cudaMemcpy与源和dest作为不同
的
类型一起使用?
、
我使用
的
是Tesla,这是我第一次在CPU内存而不是GPU内存上运行!因此,我认为可以通过
将
所有整数转换为短整型(我所有的值都小于255)来减少
主机
内存
的
大小。但是,我希望我
的
设备
内存使用整数,因为内存访问更快。那么有没有办法将我
的
主机
内存(简而言之)
复制到
我
的
设备
全局内存( int)
中
呢?
浏览 0
提问于2012-01-09
得票数 0
回答已采纳
3
回答
使用
cuda
-gdb检查全局
设备
内存
我正在尝试使用
cuda
-gdb来检查全局
设备
内存。即使在cudaMemcpy之后,这些值似乎也都是零。但是,在内核
中
,共享内存
中
的
值是好
的
。有什么想法吗?
cuda
-gdb会检查全局
设备
内存吗?看起来
主机
内存和
设备
共享内存都很好。谢谢。
浏览 2
提问于2011-07-14
得票数 7
1
回答
Bitmap.getPixel ()处理一维数组
、
、
、
但是为什么会有一维
阵列
呢?我知道这是个问题,但我不明白。 谢谢
浏览 0
提问于2017-11-21
得票数 1
回答已采纳
2
回答
cudaMallocPitch和cudaMemcpy2D
、
当
将
C++
2D
数组转换为
CUDA
一维数组时,我有一个错误。让我展示一下我
的
源代码。
如何
正确使用cudaMallocPitch()和cudaMemcpy2D()?
浏览 0
提问于2016-03-03
得票数 3
回答已采纳
4
回答
检测用户是否绘制了整个屏幕
我让用户在我
的
app.The应用程序中进行绘画,一旦整个屏幕都画好了,屏幕上就会显示一些选项。有没有一种方法可以检测用户是否绘制了整个屏幕?
浏览 0
提问于2011-03-29
得票数 0
回答已采纳
2
回答
为什么NVENC示例同时使用cuMemcpyHtoD和cuMemcpy2D复制YUV
数据
?
、
我正在学习 API.The SDK提供一个名为"NvEncoderCudaInterop“.There
的
采样代码,它是
将
YUV平面数组
从
CPU
复制到
GPU缓冲区
的
代码块。这是代码:
CUDA
_MEMCPY2D copyParam;copyParam.dstMemoryType, yuv[1], width*height / 4
浏览 6
提问于2015-10-08
得票数 3
回答已采纳
3
回答
将
非托管System.IntPtr字节向量
复制到
2D
设备
字节数组
的
GPU行
中
、
、
我使用
的
是C#和CUDAfy.net (是的,这个问题在
带
指针
的
直C语言中更容易解决,但考虑到更大
的
系统,我有理由使用这种方法)。每隔33.3毫秒,它就会在循环缓冲区
中
填充
一个插槽,
并
返回一个指向*byte
的
非托管
1D
矢量
的
*byte;循环缓冲区有15个插槽。在GPU
设备
(Tesla K40)上,我希望有一个全局
2D
数组,它被组织成一个密集
的
2D
浏览 4
提问于2014-12-25
得票数 4
回答已采纳
2
回答
CUDA
3D到线性索引映射(螺距)
、
、
我有三维
数据
,我正在使用
数据
自动化系统进行研究.(维度为N*N )
中
,我通过以下操作访问了特定元素:j = blockIdx.y*BLOCK_Y + threadIdx.y;现在我希望
将
代码扩展到3-D。k = blockIdx.z*BLOCK_Z + threadIdx.z; 但是,我
如何
把这三者结合起来,得到线性指数呢?到底什么是音调,
浏览 10
提问于2015-02-27
得票数 0
1
回答
cudaMemCpy2D崩溃
、
、
我正在尝试在
cuda
.For
中
实现Sauvola二值化这个我已经在
主机
中
读取了
2d
数组
中
的
图像,
并
使用pitch.After为
设备
中
的
2D
数组分配内存分配内存我正在尝试使用cudaMemcpy2D
将
主机
2D
数组
复制到
设备
2d
数组,它编译得很好,但在运行时它在这里崩溃。2.使用
浏览 0
提问于2012-08-28
得票数 0
回答已采纳
1
回答
如何
在
CUDA
设备
上更改稀疏矩阵
的
子矩阵
、
、
、
将
整个矩阵结构
从
系统存储器
复制到
设备
存储器可能成为相当大
的
性能瓶颈,因为在给定时间只需要改变矩阵条目的一小部分。我希望能够做
的
是有一种方法来仅更新特定
的
子集/子矩阵,而不是在每次需要更改矩阵时
将
整个矩阵结构
从
系统内存重新
复制到
设备
内存。我天真地认为,为了实现这一点,我应该在
主机
端有一个整数数组或向量,例如updateInds,它将跟踪val
中
已更改<em
浏览 0
提问于2015-06-23
得票数 0
1
回答
如何
从
包含
设备
成员变量
的
类内部调用
CUDA
内核
、
我想使用
CUDA
5.0链接来编写可重用
的
CUDA
对象。我已经设置了这个简单
的
测试,但是我
的
内核无声地失败了(运行时没有错误或异常,输出
的
是垃圾)。我
的
简单测试(如下)
将
一个整数数组分配给
CUDA
设备
内存。
CUDA
内核应该用顺序条目(0,1,2,....,9)
填充
数组。
设备
阵列
被
复制到
CPU内存
并
输出到控制台。
浏览 2
提问于2013-04-02
得票数 0
回答已采纳
1
回答
将
文件转换为灰度图像
、
、
我试图
将
文件(任何文件作为exe,apk)转换为灰度图像。我已经使用下面的代码准备了文件
的
二进制位。然而,我被困在分组8位来表示我
的
图像
中
的
一个像素,所以每个像素是
从
0-255。研究表明,恶意软件可以通过将其转换为灰度图像进行分类,
并
应用CNN模型进行分类。print("hex: %s, decimal: %s, binary: %s" % (hexadecimal, decimal, binary))我已经写了下面,在这里我确定了图像<e
浏览 1
提问于2020-02-12
得票数 1
回答已采纳
1
回答
Cuda
Memcpy
设备
到
主机
:未指明
的
错误启动失败
这是我一直在做
的
一个简单
的
测试程序(用来帮助调试我在运行求和函数上
的
工作),我似乎找不到哪里出了问题。程序只是在一个小列表上调用我
的
运行求和函数,
并
试图打印出
数据
。造成所有麻烦
的
那一行就是被注释掉
的
那行。It the cudaMemcpy(DeviceToHost)。当这一行是代码
的
一部分时,我得到
的
错误是:
CUDA
error at: student_func.cu:136 unspecifie
浏览 2
提问于2013-07-07
得票数 1
1
回答
CUDA
OPENGL互操作性:缓慢映射
、
、
、
我
的
应用程序将从openGL获取渲染结果(深度图和渲染
的
2D
图像信息)到
CUDA
进行处理。另一种方法是使用openGL<>
cuda
国际警察组织。第一步是在openGL
中
创建一个缓冲区,然后
将
图像/深度信息传递给该
浏览 5
提问于2013-04-12
得票数 3
1
回答
开普勒上更快
的
平行缩减
、
、
我只是一个
CUDA
初学者,尝试在我
的
程序中使用,但我没有得到结果,下面是我正在做
的
事情
的
函数,输出是0,我想知道我
的
错误是什么?#ifndef __CUDACC__ #endif #include <
cuda
_runtime.h>#include <iostream&
浏览 4
提问于2017-02-20
得票数 0
回答已采纳
2
回答
CUDA
2D
数组-使用元素
、
、
我正在学习
cuda
,
并
设法在那里获得了一个
2D
数组,
并
返回了一个双精度
的
2D
数组,但有一些小问题。现在,例如,我想将所有值设置为所有值
的
250,但是我似乎无法通过第一行。我似乎不能正确地循环。我怀疑它是块/线程
的
数量还是代码本身。下面是我
的
完整代码:#include <vector> #define THETA 1
浏览 0
提问于2018-07-30
得票数 0
3
回答
CUDA
上
的
二维数组
、
我想在
CUDA
中
动态分配全局
2D
数组。我
如何
才能做到这一点?int n=0,i=0;{ //call kernel(
浏览 1
提问于2011-04-12
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券