腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(2844)
视频
沙龙
1
回答
如
何在
OpenCV
固定
内存
上
分配
CUDA
/
Image
?
、
所以我使用
OpenCV
cv::Mat来读/写文件。但由于它们使用普通
内存
进行
分配
,因此将数据传输到GPU的速度很慢。有没有办法让
OpenCV
默认使用
固定
内存
(cudaMallocHost或cudaHostAlloc)?
内存
大小消耗不是问题。
浏览 27
提问于2020-06-03
得票数 1
1
回答
cublas可以进行
固定
的
内存
分配
吗?
、
我知道"cudaHostAlloc“
分配
的
固定
内存
可以比”malloc“
分配
的
内存
更有效地转移到设备
上
。然而,我认为"cudaHostAlloc”只能由
cuda
编译器编译。我的方案是使用cublas API而不使用
cuda
编译器,而且似乎cublas不提供手册中的
固定
内存
分配
功能,或者我可能遗漏了什么……
浏览 0
提问于2012-11-02
得票数 0
回答已采纳
1
回答
相当于OpenCL CL_MEM_USE_HOST_PTR的
CUDA
、
、
问题是
CUDA
分配
内存
,我没有办法将其转移到某些预先
分配
的CPU
内存
区域。对于OpenCL来说,使用clCreateBuffer的指定标志是正常的。
浏览 11
提问于2022-02-04
得票数 0
2
回答
如何将托管(统一)
内存
用于镜像?
、
、
我昨天花了一整天的时间阅读如
何在
CUDA
程序中使用托管(统一)
内存
阵列(使用这本书,我练习了一些示例代码(尽管我仍然对分析器信息有疑问),我已经准备好将它应用于同时使用
CUDA
内核和一些
OpenCV
函数的程序我有过h_
image
= cv::imread(dirname+
image
_filenames[ni], cv::IMREAD_GRAYSCALE); cv::
cuda
::GpuMat d_<
浏览 0
提问于2021-06-18
得票数 0
1
回答
cudaHostAllocMapped是否也在设备
上
分配
缓冲区?
、
、
、
for cudaHostAlloc()表示,它使用cudaHostAllocMapped标志在主机上
分配
固定
内存
,并“将
分配
映射到
CUDA
地址空间”。这是否意味着在设备
上
也
分配
了镜像缓冲区?或者,在每次访问cudaHostGetDevicePointer()返回的指针时,设备是否与主机
内存
通信? 这个问题不同于,因为我不问API是什么,什么时候使用它们,什么是
固定
内存
。我特别询问是否在GPU
上
<em
浏览 9
提问于2016-09-27
得票数 1
回答已采纳
1
回答
映射
内存
和gpu::CudaMem使用
、
、
我想知道是否有可能避免gpu和设备之间的
内存
传输。我最近读到,映射
内存
就是为了这个目的,如果我错了,请纠正我。 可以像那样节省上传时间吗? 谢谢!
浏览 2
提问于2014-02-10
得票数 1
2
回答
卡达和钉(页锁定)
内存
,根本不锁定页面?
、
、
、
我试图弄清楚当我需要
固定
(页面锁定)
内存
时,
CUDA
(或OpenCL实现)是否说出了真相。我使用mlock来分页锁定
内存
,其值
如
预期的那样上升。因此,造成这种行为的两个可能原因可能是:
CUDA
绕过操作系统计数器来锁定页面
内存
,因为
CUDA
对linux内核有一些神奇的作用因此,实际的问题是:当我使用
CUDA
分配</
浏览 1
提问于2014-11-12
得票数 8
回答已采纳
1
回答
关于数据自动化系统中的
固定
记忆,有上限吗?
、
、
、
我编写了一个应用程序,它将从
固定
内存
中受益,并且当有相当大的
固定
内存
时,可以获得最好的性能。我们订购了一台由768 to
内存
组成的服务器,我计划将~500 to的
内存
作为
固定
内存
分配
,这有什么问题吗?因为我以前从未
分配
过这么多
固定
内存
,到目前为止,在我们安装的
内存
要小得多的服务器
上
,我没有看到将大量
内存
分配
为页
浏览 1
提问于2014-03-10
得票数 0
1
回答
在计算能力5.0中,如何通过CPU和GPU同时访问托管
内存
?
、
由于在计算能力低于6.x的设备
上
同时访问托管
内存
是不可能的,是否有一种方法可以在GPU内核运行时通过CPU和GPU以计算能力5.0来模拟访问托管
内存
或使CPU访问托管
内存
。
浏览 0
提问于2019-01-22
得票数 0
回答已采纳
1
回答
在
opencv
3中使用
cuda
::形态学
、
我在一个
opencv
项目中工作,该项目使用词素函数。现在我试着用gpu的支持来完成它。当我用
OpenCV
3.0和
Cuda
7.5支持编译我的程序时,它接受除morphologyEx以外的大多数函数(
如
cuda
::阈值、
cuda
::cvtcolor等)。请注意,在
opencv
2.4.9中,吗啡被称为gpu::morphologyEx。 如
何在
OpenCV
3.0或3.1中使用此函数?如果不支持它,是否有替代此功能的方法?实际
上<
浏览 2
提问于2016-02-10
得票数 2
回答已采纳
1
回答
是否有可能改变.NET数组
分配
方法?
、
、
、
我在.NET中通过P/Invoke使用
CUDA
。在
CUDA
中,它们提供了一种特殊的
内存
分配
方法,它可以在GPU
上
分配
内存
,同时可以从主机(当然,从.NET的角度访问非托管
内存
)访问它们。这被称为
CUDA
的统一
内存
,它模糊了CPU和GPU
内存
之间的板。 那么,是否可以将默认的.NET数组
内存
分配
方法更改为自定义的非托管
内存
分配</
浏览 1
提问于2015-09-14
得票数 1
回答已采纳
1
回答
GPU对CPU端到端延迟的动态图像调整
、
、
、
、
目前,我已经使用
OpenCV
和ImageMagick进行了一些吞吐量基准测试,而且我发现与GPU的工作速度并不比CPU快得多。我们在站点
上
的使用是根据服务调用动态地调整大小到从主副本请求的大小,并试图评估拥有GPU是否有意义动态地调整每个服务调用的大小。
cuda
::GpuMat d_dst;
cuda
::resize(d_src, d_dst, Size(400, 400),0,0, CV_INTER_AREA,stream4.57
浏览 0
提问于2018-02-22
得票数 1
1
回答
不允许从__host__ __host__ __device__函子调用__device__函数
、
、
我试图在
Opencv
类中使用推力。最后的代码将更加复杂,包括使用设备
内存
,但这个简单的示例无法成功构建。>#include <
opencv
2/core.hpp> #include <
opencv
2KeyPoint *new_data_end = thrust::remove_if(h_da
浏览 1
提问于2021-06-14
得票数 0
回答已采纳
1
回答
是否所有使用相同设备的主机线程都可以看到分页锁定状态?
每个线程都使用自己的流,并且(我相信)隐式地选择默认的
Cuda
设备。 页只能显示在单个CPU线程
上
。也就是说,如果任何线程将它们作为
固定
内存
分配
,则它们将保持页面锁定,但它们只会出现在
分配
它们的线程
上
的页面锁定。他们接着说,设置cudaHostAllocPortable可以解决这个问题,并允许所有线程将
分配
识别为
固定
缓冲区。“
Cuda
C指南”似乎与此信息相冲突
浏览 10
提问于2016-09-15
得票数 0
回答已采纳
1
回答
两个进程可以共享相同的GPU
内存
吗?(库达)
、
、
、
在CPU世界中,人们可以通过
内存
映射来完成它。GPU也能做类似的事情吗? 如果两个进程可以共享一个相同的
CUDA
上下文,我认为这将是微不足道的-只是传递GPU
内存
指针。我可以想到的另一种可能性是将设备
内存
映射到
内存
映射的主机
内存
。由于它是
内存
映射的,所以它可以在两个进程之间共享。这是否合理/可能,是否有任何开销?
浏览 10
提问于2017-02-03
得票数 14
回答已采纳
1
回答
从
Cuda
设备指针创建
OpenCV
/EmguCV GpuMat
、
、
我可以从非托管缓冲区在EmguCV中创建一个Mat对象,该缓冲区可以
固定
在托管
内存
中,也可以使用AllocHGlobal创建。如何使用设备指针或
Cuda
数组在设备
上
分配
的
内存
来创建GpuMat或类似的对象。
浏览 36
提问于2016-09-03
得票数 1
1
回答
cudaFree -无效的设备指针错误
、
我正在尝试释放我在
CUDA
+ OpenGL互操作代码中
分配
的设备
内存
OpenGL。一切都很好,但我担心的是
内存
泄漏。为什么我不能释放我
分配
的本地设备
内存
?我将
cuda
_resource从像素缓冲区对象中取消映射,并取消资源注册。这就引出了另外两个问题: 我在内核中没有malloced
内存
,因为我没有。因此,利用cudaFree函数应该(技术
上
?)在这里工作对吗?是由程序员来释放提供给本地定义的指针的
内存
,
浏览 4
提问于2014-08-28
得票数 4
回答已采纳
2
回答
仅在
分配
的一部分
上
使用cudaHostRegister安全吗?
为了加速和简化传输,我想将CPU
内存
注册为不可分页(“
固定
”),例如在复制之前使用cudaHostRegister(void*, size, ...)。它似乎有效,但我不明白,一般来说,“
固定
”
分配
的一部分是否会以某种方式破坏
分配
块。更新:我担心的是
分配
实际
上
是在中提到的 cudaHostRegisterDefault:在一个具有统一虚拟寻址的系统
上
,
内存
将被映射和移植。在没有统一虚拟寻址的系统
上
,
内存</
浏览 17
提问于2021-10-08
得票数 3
回答已采纳
2
回答
随着维数的增加,为点云
分配
CUDA
设备
内存
、
、
、
我已经在CPU端C++
上
编写了一个工作代码。现在我需要用
CUDA
加快速度。我的想法是让一些块/线程(我猜每个像素一个线程)并行执行测试,如果测试结果是真的,让线程向云中添加一个点。我的麻烦来了:,如果我事先不知道要在云中插入的点的数量,如
何在
设备
内存
中为点云
分配
空间(使用cudaMalloc或类似的)? 我是否必须
分配
一个
固定
数量的
内存
,然后每次点云达到极限时增加它?还是有一种“动态”
分配
内存
的方法?
浏览 7
提问于2016-04-22
得票数 4
1
回答
cuMemHostAlloc
内存
不足错误
、
我遇到了一个
内存
分配
问题,我不太明白。我正在尝试
分配
相当大的GPU
内存
块(我猜这可能是
内存
碎片问题?)我非常简化的代码是:#include <
cuda
.h> { CUdevice dev = 0但是我有超过4 4GB的空闲
内存
。 然后我也想
分配
图形处理器
内存
,如果我尝试用cuMemAlloc
分配
浏览 4
提问于2012-08-15
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券