腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
是否
可以
在
Visual
Studio
中
编写
的
MexGateway
代码
中
为
CPU
/
GPU
内存
预先
分配
变量
?
memory
、
cuda
、
mex
我正在尝试
编写
一个
MexGateway
代码
,将Matlab
中
的
两个
变量
传递给编译后
的
MexFile,将
变量
复制到cuda内核,进行处理并将结果带回matlab。我需要在matlab
的
for循环中使用这个MexFile。 问题是:这两个输入对于我
的
应用程序来说很大,并且
在
每个循环中只有一个输入(在下面的
代码
中
称为Device_Data )是变化
的
。
浏览 23
提问于2021-05-21
得票数 1
回答已采纳
3
回答
CUDA -从
GPU
分配
常量/纹理
内存
memory-management
、
cuda
、
constants
我应该用CUDA写一段
代码
,
在
递归循环中计算一个数组。有可能在它之前
预先
计算这个递归循环
的
一些中间步骤,即
分配
一些常数数组和标量,这将避免循环中
的
一些计算。第一个想法是将常量数组存储
在
全局
内存
中
,而标量参数每次都从
CPU
传递到
GPU
(这里建议:)。 我想尝试使用
GPU
常量
内存
,因为它应该更快。但是,我找到
的
几个示例
代码
说明了如
浏览 7
提问于2013-01-28
得票数 1
回答已采纳
2
回答
如何评估CUDA性能?
performance
、
cuda
我自己
编写
了CUDA内核。与
CPU
代码
相比,我
的
内核
代码
比
CPU
快10倍。我如何评估我
的
内核
代码
的
性能? 理论上如何计算CUDA
的
浏览 1
提问于2012-08-11
得票数 5
回答已采纳
1
回答
你一次能传递多少张图片给Caffe?
machine-learning
、
computer-vision
、
neural-network
、
deep-learning
、
caffe
我(例如)
可以
将这个数字设置
为
200甚至500,这样我一次就
可以
接受多达200/500张图像,而不会对预测产生负面影响吗?
浏览 0
提问于2015-09-15
得票数 1
回答已采纳
1
回答
vs 2010
中
的
opencl调试器设置
opencl
我只想问一个非常简单
的
问题:
在
visual
studio
2010
中
哪里
可以
找到opencl调试器配置对话框。vs2010
中
没有
代码
生成器选项卡,我
在
tools选项卡下也找不到它。我只想启用opencl调试器,使用工作项值并调试我
的
内核
代码
。附言:从安装到
代码
构建再到应用程序执行,一切都运行得很好。我只想知道为什么opencl sdk调试器插件没有出
浏览 0
提问于2017-05-20
得票数 0
1
回答
GPU
vs
CPU
?
GPU
中用于程序计算加速
的
内核/线程数?
multithreading
、
performance
、
parallel-processing
、
gpgpu
、
multicore
Boom -我现在创建了四个线程,
CPU
使用率
为
100% (而不是只有一个内核
的
CPU
使用率
为
25% )。我
的
"for“循环现在
的
运行速度几乎是没有并行化
的
情况下
的
四倍。顺便说一下,对于" for“循环,我使用了Microsoft
Visual
Studio
2012上可用
的
自动并行化,如这个在线示例所示:()。相比之下,我甚至不知道我
的
笔记本电
浏览 1
提问于2013-04-22
得票数 6
1
回答
使用
visual
studio
代码
在
GPU
中
运行PyTorch
python
、
visual-studio-code
、
deep-learning
、
pytorch
我试图
在
visual
studio
代码
中使用pytorch执行
代码
,问题是我必须能够
在
CPU
上执行。但我
的
想法是,对于某些深度学习项目,应该使用
gpu
,而不是其他项目。如何在运行时从
CPU
切换到
GPU
torch.cuda.is_available()我已经安装了cuda。我使用
的
是Ubuntu 20.
浏览 2
提问于2021-03-10
得票数 0
1
回答
是否
有可能改变.NET数组
分配
方法?
c#
、
.net
、
memory-management
、
cuda
我
在
.NET
中
通过P/Invoke使用CUDA。
在
CUDA
中
,它们提供了一种特殊
的
内存
分配
方法,它
可以
在
GPU
上
分配
内存
,同时
可以
从主机(当然,从.NET
的
角度访问非托管
内存
)访问它们。这被称为CUDA
的
统一
内存
,它模糊了
CPU
和
GPU
内存
浏览 1
提问于2015-09-14
得票数 1
回答已采纳
1
回答
可以
在
visual
studio
中分析
gpu
内存
吗?
c++
、
visual-studio
、
gpu
我想知道
是否
有任何方法
可以
在
visual
studio
中
查看
gpu
的
原始vram
内存
。就像从
visual
studio
打开
内存
布局一样,它显示了进程
内存
。大多数主题都是关于
gpu
使用
的
,我实际上想要在我
的
应用程序执行期间查看
gpu
内存
的
原始比特和字节。我知道
浏览 90
提问于2020-08-16
得票数 1
1
回答
cudaMallocManaged()
是否
在
RAM和VRAM
中
创建同步缓冲区?
c++
、
cuda
在
Nvidia开发者博客:
中
,作者解释道: 要在
GPU
上计算,我需要
分配
GPU
可以
访问
的
内存
。CUDA
中
的
统一
内存
通过提供系统中所有
GPU
和
CPU
可以
访问
的
单个
内存
空间来简化操作。要在统一
内存
中
分配
数据,请调用cudaMallocManaged(),它返回
可以</e
浏览 1
提问于2020-09-16
得票数 1
回答已采纳
2
回答
如何分析xamarin.forms应用程序?
xamarin
、
memory-leaks
、
xamarin.forms
、
profile
我想知道如何分析我
的
应用程序并检查
内存
分配
和泄漏。目前,(2016/12/2) iOS工具不适用于我。它一开始就冻结了。如何检查
内存
泄漏? 谢谢。
浏览 3
提问于2016-12-02
得票数 1
2
回答
VS2013:"VSP2340:未正确设置环境
变量
“,即使从集成开发环境
中
运行也是如此
c#
、
visual-studio-2013
、
profiler
、
environment
如果我选择默认
的
CPU
采样,那么性能分析就会起作用,并且我
可以
看到结果。但是,如果我选择第三个选项,.NET
内存
分配
,那么
在
我
的
应用程序完成后,我会在
Visual
Studio
输出窗口中看到空
的
结果和以下错误: VSP2340: Environment variables
Visual
Studio
中
的
性能向导。但结果是一样
的
;我
浏览 0
提问于2014-10-03
得票数 6
2
回答
跟踪
visual
studio
中
的
变量
更改
c
、
visual-studio-2005
、
malloc
、
free
在
visual
中
,我有一个问题,就是
在
一个非常大
的
代码
库
中
找出谁在为
变量
分配
内存
。struct test char *point;obj->point = malloc(100);
变量
obj
在
整个
代码
中
传递,并且
在
某个位置
浏览 7
提问于2013-12-03
得票数 3
回答已采纳
1
回答
如何将任务
分配
给
GPU
cpu
、
gpu
我从computerbase.de (德语
中
的
http://www.computerbase.de/artikel/grafikkarten/2013/intel-haswell-grafik-fuer-desktop-pcs-im-test/3/)中找到了一个基准,其中一个任务(这里是视频转码)是由
CPU
完成
的
,另一个是由(集成
的
)
GPU
完成
的
:如何在linux
中
显
浏览 0
提问于2013-07-18
得票数 3
回答已采纳
1
回答
向量化
代码
中
随机减速
的
原因
c
、
performance
、
sse
、
avx
、
avx2
我
在
一个项目中使用AVX2、AVX和SSE编译器内部函数
编写
了一个特定
的
函数。我知道当
CPU
在
AVX/AVX2和SSE模式之间改变状态时
的
损失,所以我
在
Visual
Studio
项目设置中将增强指令集设置
为
AVX2。
在
我
的
代码
中
,我
在
for循环中重复使用了一些数据。我使用boost计时器、
Visual</em
浏览 7
提问于2017-02-01
得票数 2
1
回答
如何让
GPU
输入作为Vulkan API
中
的
变量
在
着色器中使用?
linux
、
gpu
、
shader
、
vulkan
数据
可以
通过HDMI、Display PORT、DVI、VGA等发送到
GPU
。我不知道接下来会发生什么,可能是
GPU
解码并发送到
CPU
,或者只是发送到
CPU
并解码它。我怀疑
GPU
在
将输入数据发送到
CPU
之前会将数据保存到
内存
中
,因此
可以
从着色器访问这些数据。也许,
在
代码
中
,它应该类似于着色器
中
的
变量</
浏览 12
提问于2019-10-12
得票数 0
1
回答
我们
可以
使用Renderscript来实现
代码
中
面向安全
的
部分吗?
android
、
security
、
renderscript
建议使用NDK
在
C
中
实现Android应用程序
代码
中
敏感
的
或面向安全
的
部分,因为它不能像Java
代码
那样容易地分解,您
可以
更多地控制
内存
分配
等等。但是现在我们也有了Renderscript,它
的
代码
也是用C
编写
的
,
在
设备上后台编译后,它直接在
CPU
/
GPU
上运行。 Renderscr
浏览 3
提问于2014-03-23
得票数 0
回答已采纳
1
回答
HD6950 -获取数据采集错误
的
挖掘
mining
、
cpp-ethereum
、
dag
、
genoil
因为我刚刚升级了我
的
钻机,我让我
的
旧
GPU
无所事事,所以我想我
可以
开始使用它。生物之星A68N-2100 (让那东西到处乱放)8GB DDR3
内存
虚拟
内存
设置
为
16 GB使用.ba
浏览 0
提问于2017-06-22
得票数 0
2
回答
如何正确使用CUDA
中
的
全局
内存
?
c++
、
c
、
memory-management
、
cuda
、
gpu
我试图
在
CUDA
中
做一个应用程序,它使用用device定义
的
全局
内存
。此
变量
在
.cuh文件
中
声明。cudaMalloc((void**)&varOne,*tam_varOne * sizeof(cuComplex)); cudaMemcpy(varOne,C_varO
浏览 0
提问于2012-11-07
得票数 1
2
回答
CUDA:内核有可能将中断返回给
CPU
吗?
cuda
、
gpu
、
break
我正在写一个使用CUDA并行化
的
C程序,我想知道内核
是否
有可能return a break到
CPU
。我
的
程序基本上做了一个for循环,在这个循环中,我采取了几个并行
的
操作;
在
每次迭代开始时,我必须控制驻留在
GPU
上
的
一个
变量
(测量刚刚完成
的
迭代
的
改进)。我希望对该
变量
的
控制返回一个break给
CPU
,以便退出for循环(我使用一个简单
的<
浏览 0
提问于2014-04-21
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券