是否可以在Visual Studio中编写的MexGateway代码中为CPU/GPU内存预先分配变量？

文章/答案/技术大牛

发布

1回答

memory、cuda、mex

我正在尝试编写一个MexGateway代码，将Matlab中的两个变量传递给编译后的MexFile，将变量复制到cuda内核，进行处理并将结果带回matlab。我需要在matlab的for循环中使用这个MexFile。问题是:这两个输入对于我的应用程序来说很大，并且在每个循环中只有一个输入(在下面的代码中称为Device_Data )是变化的。

浏览 23提问于2021-05-21得票数 1

回答已采纳

3回答

CUDA -从GPU分配常量/纹理内存

memory-management、cuda、constants

我应该用CUDA写一段代码，在递归循环中计算一个数组。有可能在它之前预先计算这个递归循环的一些中间步骤，即分配一些常数数组和标量，这将避免循环中的一些计算。第一个想法是将常量数组存储在全局内存中，而标量参数每次都从CPU传递到GPU (这里建议：)。我想尝试使用GPU常量内存，因为它应该更快。但是，我找到的几个示例代码说明了如

浏览 7提问于2013-01-28得票数 1

回答已采纳

2回答

如何评估CUDA性能？

performance、cuda

我自己编写了CUDA内核。与CPU代码相比，我的内核代码比CPU快10倍。我如何评估我的内核代码的性能？理论上如何计算CUDA的

浏览 1提问于2012-08-11得票数 5

回答已采纳

1回答

你一次能传递多少张图片给Caffe？

machine-learning、computer-vision、neural-network、deep-learning、caffe

我(例如)可以将这个数字设置为200甚至500，这样我一次就可以接受多达200/500张图像，而不会对预测产生负面影响吗？

浏览 0提问于2015-09-15得票数 1

回答已采纳

1回答

vs 2010中的opencl调试器设置

opencl

我只想问一个非常简单的问题:在visual studio 2010中哪里可以找到opencl调试器配置对话框。vs2010中没有代码生成器选项卡，我在tools选项卡下也找不到它。我只想启用opencl调试器，使用工作项值并调试我的内核代码。附言:从安装到代码构建再到应用程序执行，一切都运行得很好。我只想知道为什么opencl sdk调试器插件没有出

浏览 0提问于2017-05-20得票数 0

1回答

GPU vs CPU？GPU中用于程序计算加速的内核/线程数？

multithreading、performance、parallel-processing、gpgpu、multicore

Boom -我现在创建了四个线程，CPU使用率为100% (而不是只有一个内核的CPU使用率为25% )。我的"for“循环现在的运行速度几乎是没有并行化的情况下的四倍。顺便说一下，对于" for“循环，我使用了Microsoft Visual Studio2012上可用的自动并行化，如这个在线示例所示：()。相比之下，我甚至不知道我的笔记本电

浏览 1提问于2013-04-22得票数 6

1回答

使用visual studio代码在GPU中运行PyTorch

python、visual-studio-code、deep-learning、pytorch

我试图在visual studio代码中使用pytorch执行代码，问题是我必须能够在CPU上执行。但我的想法是，对于某些深度学习项目，应该使用gpu，而不是其他项目。如何在运行时从CPU切换到GPUtorch.cuda.is_available()我已经安装了cuda。我使用的是Ubuntu 20.

浏览 2提问于2021-03-10得票数 0

1回答

是否有可能改变.NET数组分配方法？

c#、.net、memory-management、cuda

我在.NET中通过P/Invoke使用CUDA。在CUDA中，它们提供了一种特殊的内存分配方法，它可以在GPU上分配内存，同时可以从主机(当然，从.NET的角度访问非托管内存)访问它们。这被称为CUDA的统一内存，它模糊了CPU和GPU内存

浏览 1提问于2015-09-14得票数 1

回答已采纳

1回答

可以在visual* studio中分析gpu内存吗？*

c++、visual-studio、gpu

我想知道是否有任何方法可以在visual studio中查看gpu的原始vram内存。就像从visual studio打开内存布局一样，它显示了进程内存。大多数主题都是关于gpu使用的，我实际上想要在我的应用程序执行期间查看gpu内存的原始比特和字节。我知道

浏览 90提问于2020-08-16得票数 1

1回答

cudaMallocManaged()是否在RAM和VRAM中创建同步缓冲区？

c++、cuda

在Nvidia开发者博客：中，作者解释道：要在GPU上计算，我需要分配GPU可以访问的内存。CUDA中的统一内存通过提供系统中所有GPU和CPU可以访问的单个内存空间来简化操作。要在统一内存中分配数据，请调用cudaMallocManaged()，它返回可以</e

浏览 1提问于2020-09-16得票数 1

回答已采纳

2回答

如何分析xamarin.forms应用程序？

xamarin、memory-leaks、xamarin.forms、profile

我想知道如何分析我的应用程序并检查内存分配和泄漏。目前，(2016/12/2) iOS工具不适用于我。它一开始就冻结了。如何检查内存泄漏？谢谢。

浏览 3提问于2016-12-02得票数 1

2回答

VS2013："VSP2340:未正确设置环境变量“，即使从集成开发环境中运行也是如此

c#、visual-studio-2013、profiler、environment

如果我选择默认的CPU采样，那么性能分析就会起作用，并且我可以看到结果。但是，如果我选择第三个选项，.NET内存分配，那么在我的应用程序完成后，我会在Visual Studio输出窗口中看到空的结果和以下错误： VSP2340: Environment variablesVisual Studio中的性能向导。但结果是一样的；我

浏览 0提问于2014-10-03得票数 6

2回答

跟踪visual* studio中的变量更改*

c、visual-studio-2005、malloc、free

在visual中，我有一个问题，就是在一个非常大的代码库中找出谁在为变量分配内存。struct test char *point;obj->point = malloc(100); 变量obj在整个代码中传递，并且在某个位置

浏览 7提问于2013-12-03得票数 3

回答已采纳

1回答

如何将任务分配给GPU

cpu、gpu

我从computerbase.de (德语中的http://www.computerbase.de/artikel/grafikkarten/2013/intel-haswell-grafik-fuer-desktop-pcs-im-test/3/)中找到了一个基准，其中一个任务(这里是视频转码)是由CPU完成的，另一个是由(集成的)GPU完成的：如何在linux中显

浏览 0提问于2013-07-18得票数 3

回答已采纳

1回答

向量化代码中随机减速的原因

c、performance、sse、avx、avx2

我在一个项目中使用AVX2、AVX和SSE编译器内部函数编写了一个特定的函数。我知道当CPU在AVX/AVX2和SSE模式之间改变状态时的损失，所以我在Visual Studio项目设置中将增强指令集设置为AVX2。在我的代码中，我在for循环中重复使用了一些数据。我使用boost计时器、Visual</em

浏览 7提问于2017-02-01得票数 2

1回答

如何让GPU输入作为Vulkan API中的变量在着色器中使用？

linux、gpu、shader、vulkan

数据可以通过HDMI、Display PORT、DVI、VGA等发送到GPU。我不知道接下来会发生什么，可能是GPU解码并发送到CPU，或者只是发送到CPU并解码它。我怀疑GPU在将输入数据发送到CPU之前会将数据保存到内存中，因此可以从着色器访问这些数据。也许，在代码中，它应该类似于着色器中的变量</

浏览 12提问于2019-10-12得票数 0

1回答

我们可以使用Renderscript来实现代码中面向安全的部分吗？

android、security、renderscript

建议使用NDK在C中实现Android应用程序代码中敏感的或面向安全的部分，因为它不能像Java代码那样容易地分解，您可以更多地控制内存分配等等。但是现在我们也有了Renderscript，它的代码也是用C编写的，在设备上后台编译后，它直接在CPU/GPU上运行。 Renderscr

浏览 3提问于2014-03-23得票数 0

回答已采纳

1回答

HD6950 -获取数据采集错误的挖掘

mining、cpp-ethereum、dag、genoil

因为我刚刚升级了我的钻机，我让我的旧GPU无所事事，所以我想我可以开始使用它。生物之星A68N-2100 (让那东西到处乱放)8GB DDR3内存虚拟内存设置为16 GB使用.ba

浏览 0提问于2017-06-22得票数 0

2回答

如何正确使用CUDA中的全局内存？

c++、c、memory-management、cuda、gpu

我试图在CUDA中做一个应用程序，它使用用device定义的全局内存。此变量在.cuh文件中声明。cudaMalloc((void**)&varOne,*tam_varOne * sizeof(cuComplex)); cudaMemcpy(varOne,C_varO

浏览 0提问于2012-11-07得票数 1

2回答

CUDA:内核有可能将中断返回给CPU吗？

cuda、gpu、break

我正在写一个使用CUDA并行化的C程序，我想知道内核是否有可能return a break到CPU。我的程序基本上做了一个for循环，在这个循环中，我采取了几个并行的操作；在每次迭代开始时，我必须控制驻留在GPU上的一个变量(测量刚刚完成的迭代的改进)。我希望对该变量的控制返回一个break给CPU，以便退出for循环(我使用一个简单的<

浏览 0提问于2014-04-21得票数 0

点击加载更多