GPU作为CPU的可行性？

文章/答案/技术大牛

发布

8回答

cuda、cpu、gpu、gpgpu

您认为像CUDA这样的GPU作为CPU计划的未来是什么？你认为它们会成为主流并成为行业中的下一个时尚吗？苹果正在构建一个使用GPU完成CPU任务的新框架，Nvidias CUDA项目在科学领域取得了很大成功。你会建议学生把时间投入到这个领域吗？

浏览 0提问于2008-08-26得票数 13

回答已采纳

4回答

在普通windows计算机上运行深度学习

machine-learning、conv-neural-network

我想尝试一个非常简单的使用CNN学习的案例(比方说有5000张图片的数据库的数字识别)。每次我读教程的时候，他们都会提到我没有的全新的GPU或linux服务器。我只有一台简单的windows笔记本电脑。所以我的问题很简单:在基本硬件上运行“简单”CNN的最佳方式是什么？

浏览 15提问于2016-10-20得票数 0

2回答

nVidia数据自动化系统代码不工作？

c++、cuda

这是我的代码：{} void gpu_load(TYPE data(TYPE* cpu_var, TYPE* gpu_var) int size = 1;} tem

浏览 1提问于2013-12-06得票数 1

回答已采纳

1回答

有没有一种方法可以在奇怪大小的数据数组上使用CUB::BlockScan？

cuda、cub

所有示例都对大小为32倍的数组执行扫描。最快的示例使用256个或更多的线程，每个线程分配4个或4个以上的元素。这意味着，如果我有一个大小为450的数组，那么，想必我必须将其压缩到512，然后每个执行256个线程分配两个元素。好吧，让我们说得更清楚。这是一个简化的例子。假设我有两个数组，一个数组就是第二个数组

浏览 4提问于2019-04-27得票数 0

回答已采纳

1回答

使用存储在GPU内存中的“计数”参数调用glDrawArray

opengl、opengl-4

在绘制调用#1期间，我将在片段着色器中生成一个缓冲区(作为SSBO访问)。然后，我希望使用该缓冲区(作为VBO访问)作为绘制调用#2的输入。问题是，使用函数void glDrawArrays(GLenum mode, GLint first, GLsizei count)，我应该知道CPU上的count值。但在CPU上我不知道这个值。该值仅作为原子计数器存储在GPU内存中。是否有任何方法使用存储在GPU内存中<em

浏览 0提问于2019-03-10得票数 2

回答已采纳

1回答

库达定时器- CPU对GPU？

cuda

我试图理解使用CUDA定时器(事件)和常规CPU定时方法(gettimeofday在Linux上等)执行内核定时之间的区别。通过阅读第8.1节，我觉得唯一真正的区别是，当使用CPU计时器时，需要记住同步GPU，因为调用是异步的。想必CUDA事件API会为您做这件事。所以，这是否真的是一个问题：通过GPU事件，您可以获得一个固有的独立于平台的定时API，

浏览 2提问于2013-12-21得票数 0

回答已采纳

2回答

clGetMemObjectInfo有时返回假结果[OpenCL]

c++、parallel-processing、opencl

我有一个笔记本电脑(，英特尔，i5，CPU，，，英特尔，HD，4000，GPU，集成)和NVIDIA GT653M作为离散GPU。我使用CPU作为主机，HD4000 GPU作为设备。Q1:现在，当我使用clGetMemObjectInfo ()函数获取包装数组的内存缓冲区的主机指针(CL_MEM_HOST_PTR)时，该函数有时正确地返回指针，有时返回0。我的代码很简单，我想知道为什么会发生这种情

浏览 0提问于2014-02-06得票数 0

回答已采纳

1回答

Pytorch嵌入对GPU来说太大，但适合CPU

pytorch-lightning

我正在使用PyTorch闪电，所以雷电控制GPU/CPU分配，作为回报，我得到了多GPU的培训支持。然后，当我为批处理选择子集时，将其发送到GPU。GPU_tensor = embedding(idx) 我怎么才能在毕火炬闪电中做到这一点？

浏览 1提问于2021-03-27得票数 0

回答已采纳

1回答

为什么我们需要image.to('CUDA')当我们有model.to('CUDA')

python、pytorch

我正在上关于PyTorch的课程。我想知道为什么我们需要分别告诉torch.utils.data.DataLoader输出它运行在什么设备上。device) 是否有一个用例，我希望在GPU上运行模型，但我的输入处于

浏览 1提问于2018-12-09得票数 1

回答已采纳

1回答

无数据传输延迟的GPU* (CUDA)非线性优化*

cuda、mathematical-optimization

我试图完全在GPU上执行一个非线性优化问题。目标函数的计算和GPU到CPU的数据传输是制约GPU性能的瓶颈。为了解决这个问题，我想对目标进行严重并行化计算，在GPU.上执行整个优化。在GPU上，f0(x)确实是快速的，但是x从CPU传输到GPU，然后将F和DF从GPU传输回CPU需要一段时间(~1秒总计)。因为函数每次迭代被调用几十个时间，这导

浏览 6提问于2020-01-08得票数 1

1回答

CPU和GPU的代码库相同

c、gpgpu

有人在维护CPU和GPU的单一代码库方面有经验吗？我想创建一个应用程序，如果可能的话，它将使用GPU进行一些长期的计算，但如果目标机器上没有兼容的GPU，它将只使用常规的CPU版本。如果我可以使用条件编译指令编写一部分代码，它将编译成CPU版本和GPU版本，这将是非常有帮助的。当然，对于CPU和GPU，会有一些不同的部分，但我希

浏览 1提问于2012-03-09得票数 5

1回答

有没有办法将我所有的GPUs设置为XLA，这样我就可以使用多个gpus而不仅仅是一个gpus了？

tensorflow、keras、gpu、nvidia

我想使用多个GPU来训练keras模型。我的理解是，您目前不能使用XLA来训练多个gpus。问题是我不知道如何关掉XLA。每个gpu都被列为xla GPU。作为参考，我在最新的Ubuntu桌面上使用3 RTX2070s。nvidia-smi确实显示了所有3个gpus。 To call `multi_gpu_model` with `gpus=3`, we expect the fol

浏览 0提问于2019-08-09得票数 5

2回答

OpenCV图形处理器库用于矩阵操作有多好？

c++、opencv、cuda、gpu、thrust

我正在使用OpenCV作为计算机视觉的应用程序。我想加速GPU上的一些矩阵运算(矩阵是相当大的)，如果可能的话，我希望避免直接在CUDA C中编码。OpenCV 2.4.1具有许多GPU加速功能。目前，我的GPU加速(和矢量化)实现在Matlab中使用并行计算工具箱(PCT)大约比我的C++实现的OpenCV快5-10倍。distance on GPU % Returns K(i,j) = (P(i

浏览 6提问于2012-06-29得票数 7

回答已采纳

1回答

Python:数组搜索改进

python、arrays、list

对于python，我还没有完全找到一种更好地改进它的方法(即使我知道这不是正确的方法)。我有一个具有这种格式的元素列表:高CPU，中GPU，高RAM，有27种可能的组合，对于每一个组合，我想为熊猫添加一个家庭组合，作为一个新的价值。def match_l

浏览 3提问于2018-05-31得票数 0

回答已采纳

1回答

如何在caffe中改变GPU模式和CPU模式？

caffe、pycaffe

我试图在caffe中运行一个代码，它显示了CPU模式。我的问题是，在安装caffe之后，是否可以对配置文件进行精化？如果是，怎么做？~/caffe-master$ SOME_COMMANDS BLAH BLAH 如何将运行从CPU模式切换到GPU模式，反之亦然？我真的很感激你能帮我。我是首席执行官和蟒蛇的初学者。谢谢

浏览 2提问于2016-12-13得票数 0

2回答

使用tensorflow.js加载的图形模型可以使用图形处理器上的数据，而不需要先将数据传输到中央处理器吗？

javascript、gpu、cpu、tensor、tensorflow.js

我目前正在使用TFJS3.8在客户端加载一个分段模型(作为tf.GraphModel加载)。为了创建输入Tensor，我调用了browser.fromPixels(imageData)，它从同样位于CPU上的Tensor对象创建CPU上的ImageData。所有这些都运行得很好，除了我的ImageData对象是从带有WebGLRenderingContext的画布上的图像创建的，这意味着它来自GPU。这种GP

浏览 42提问于2021-10-22得票数 1

回答已采纳

1回答

Ubuntu -如何判断是否AVX或SSE，当前正在使用的CPU应用程序？

gpu、sse、avx、avx2、boinc

我目前运行BOINC跨多个具有GPU的服务器。服务器同时运行GPU和CPU BOINC应用程序。当AVX和SSE在CPU应用程序中使用时减慢CPU freq的速度时，我必须选择我一起运行的CPU/GPU，因为一些GPU应用程序会被瓶颈(运行时完成速度较慢)，而其他应用则不然。目前，一些CPU应用程序是命名的，所以很明显，他们是否使用AVX，但大多数不是

浏览 36提问于2020-02-20得票数 0

回答已采纳

1回答

使用自定义估计器api的tensorflow代码在google cloud-ml引擎中还是在本地机器中有效地使用gpu？

python、tensorflow、google-cloud-platform、google-cloud-ml、tensorflow-estimator

网络是如此巨大，它应该使用大量的gpu，但在ml-engine的作业详细信息页面中显示，它没有使用主cpu以及gpu。尽管主cpu和gpu中的一些内存正在被使用。我使用"complex_model_s“作为主cpu，使用"standard-gpu”作为辅助处理器，并使用类型为"standard“的参数服务器。自开始训练以来，它也不会输

浏览 3提问于2018-07-05得票数 0

点击加载更多