linux amp gpu_amp linux_linux open amp - 腾讯云开发者社区

、、

#include <amp.h> { class Process publicI want operator() to be restrict(amp) if DataToProcess is Data::GPU and restrict(cpu) if DataToProcess时，它需要限制(Amp)。我在AMP文档中看到有一天会出现一个限制(Au

浏览 3提问于2015-03-11得票数 1

1回答

C++ AMP计算与WPF显卡双重使用性能

、、、、

情况：我将能够，并将分别衡量AMP的性能，因为它是低水平和新的功能，我将设置在一个单独的项目无论如何。WPF呈现部分已经存在于一个复杂的应用程序中，因此很难隔离它。

浏览 2提问于2014-03-01得票数 2

1回答

未来将存在哪些新的C++ AMP加速器？

我一直在学习C++ AMP，我所看到的一切都强调AMP在“加速器”上工作，而不仅仅是GPU。我认为，今天，所有的加速器都是GPU，但未来可能会有不同类型的加速器。那么，还有什么可以成为加速器呢？是现在正在开发新的加速器，还是AMP只是试图成为未来的证明？

浏览 0提问于2012-09-10得票数 4

回答已采纳

1回答

在从一个了解到，我的VS 2017 C++ AMP项目基本上是健全的，错误信息虽然正确但掩盖了真正的问题，问题是某些代码行，我重写了下面的代码。这让我不禁要问:并发运行时或C++ AMP是否需要安装GPU硬件才能正确构建和/或执行？我的机器有两个多核CPU处理器，但GPU硬件还没有安装.尽管如此，我仍然认为我可以使用并行结构来利用我拥有的处理器。#include "pch.h"#include "amp.h&qu

浏览 1提问于2019-01-23得票数 1

回答已采纳

2回答

将数据从GPU复制到CPU

3000x3000的数组，并将计算过程重复20000次： extent<2> ext(_height,_width); array<int, 2> GPU_res(ext,gpuDevice.default_view); array_view<

浏览 0提问于2012-12-19得票数 4

回答已采纳

1回答

删除指针数组GPU (动态分配)数据后，C++和GPU数据是不自由的

#include "stdafx.h" #include <assert.h> dest.discard_data(); {delete P_GPU; // the DATA

浏览 4提问于2014-09-26得票数 0

1回答

用C++-AMP实现面向对象编程

为了使用GPU实现算法，我需要更新一些用于算法的代码。然而，代码严重依赖于面向对象的编程模型.我的问题是，是否有可能将对象传递给parallel for each？C++-AMP是我在GPU编程中使用的第一种语言.因此，我在这个领域的经验是有限的。

浏览 0提问于2013-11-04得票数 2

回答已采纳

1回答

减少C++Amp中GPU-CPU数据传输

、、、、

在使用C++Amp优化应用程序时，我遇到了以下问题:数据传输。对我来说，将数据从CPU复制到GPU没有问题(因为我可以在应用程序的初始状态下这样做)。更糟糕的是，我需要快速访问C++Amp内核计算的结果，所以GPU和CPU之间的瓶颈是痛苦的。我读到在Windows8.1下有一个性能提升，但是我使用的是Windows 7，我不打算改变它。tile<_tile_size>(), [=, &a, &a_partial_result] (concurrency::tiled_index<_tile

浏览 4提问于2014-02-19得票数 4

回答已采纳

2回答

如果我已经在手动线程我的应用程序，我应该使用C++ AMP吗？

我不知道C++ AMP有什么好处。如果我已经多线程了我的应用程序(在本例中是射线追踪器)来使用系统上的所有n个核，我应该使用C++ AMP吗，或者这实际上会产生更多的瓶颈吗？

浏览 5提问于2012-10-11得票数 1

回答已采纳

3回答

在GPU上运行MSIL

、、、、

也许这是一个疯狂的问题，但有可能在GPU上运行线程吗？我问的原因是我有一些相当复杂的计算要执行(主要是数学和数组)，我想看看我是否可以使用GPU在速度上有所提高。

浏览 1提问于2011-10-19得票数 15

回答已采纳

1回答

'cudart64_100.dll‘。TensorFlow要求将此DLL安装在%PATH%中指定的目录中

、、

我正在尝试使用神经网络，但在导入Tensorflow时遇到问题。几个月前，它工作得很好。我想我一直在试图在没有显卡的情况下访问我的显卡，或者至少没有访问它。目前，错误是这样的： >>> import tensorflow OSError Traceback (most recent call last) ~\AppData\Roaming\Python\P

浏览 101提问于2020-04-09得票数 0

回答已采纳

1回答

F#的C++ AMP库有用吗？

、、、

我正在试验F#中的GPU库，以此作为使用C++并行工作的一种方式。然而，我得到的结果似乎并不直观。a view over the data on the CPU }); dataView.synchron

浏览 0提问于2012-12-24得票数 5

回答已采纳

1回答

如何在CPU和GPU设备上同时运行任务？

、

因此，我希望做到以下几点： int numberOfTasks = 1000; // RunTasksAMP(start,end) sends a rest

浏览 0提问于2013-11-05得票数 5

回答已采纳

1回答

简单图像处理示例中的C++AMP异常

、、、、

我试着教自己C++AMP，我想从我的领域开始一个非常简单的任务，那就是图像处理。我想把每像素24位的RGB图像(位图)转换成每像素8位的灰度图像。我知道C++AMP由于某些原因不能通过array或array_view处理char或unsigned char数据，所以我尝试根据使用textures。到目前为止，我使用的代码是：gpu::grap

浏览 1提问于2014-03-19得票数 1

回答已采纳

1回答

C++安放在Tegra4 surface2上

、、、

我正在尝试移植一个C++ AMP应用程序，以便在Surface 2平板上运行。由于C++ AMP在平板电脑上使用WinRT，而且它使用DirectX加速GPU，而且Tegra处理器确实与DirectX一起工作，所以我希望在平板上使用C++ AMP而不是使用"cpu“来提高性能。我在桌面上看到了大约80x的加速，与使用单个CPU内核相比，在GPU上使用相同的代码，而且高度并行。事实证明，平板电脑上的AMP解决方案只会给我带来Tegras四核的好处，但仅此而已。我有三个C++ <

浏览 2提问于2014-03-02得票数 2

回答已采纳

1回答

PPL和AMP比序贯变换性能差

、、、、

我编写了以下简短的测试代码来测试C++AMP和std::transform的顺序STL实现的PPL库的性能。令我惊讶的是，C++AMP和PPL实现都明显不如顺序实现(C++AMP: 128 my，PPL: 51 my，顺序:25 my)。这种模式适用于int、float和double数据类型。对于较小的大小(可能少于几千)，我预计顺序代码将是最快的，因为将数据从CPU复制到GPU有很大的时间延迟，而对于PPL来说，线程启动等方面会有轻微的延迟，但是我并不认为大尺寸(100000+)的顺序代码会获胜我在Visual 2013

浏览 0提问于2014-07-05得票数 2

回答已采纳

1回答

C++放大器:传输数据异步和在加速器上保存数据

、、、

显然，每个调用都必须将#1复制到GPU上。为此，我使用了一个堆栈管理的const array<>，它工作得很好。对于#2，最优的情况是将向量保留在GPU内存中，因为它是常量的。这能用安培吗？对于#3，是否可以在GPU上分配缓冲区并将其复制回来，而不是在cpu堆栈上创建一个空缓冲区，复制它，并在结果写入它之后将它复制回来？最后一件事，因为本质上的parallel_for_each调用是异步的，并且将由#3或array_view::synchronize()的析构函数同步，那么是否有可能离开当前函数(和堆栈空间)，在GPU

浏览 2提问于2014-08-26得票数 2

1回答

混合精度学习，torch.cuda.amp运行速度比正常慢

、、、

但是，我想在推断的同时获得更快的结果，所以我只在运行测试推理用例时启用了torch.cuda.amp.autocast()函数。model normallytensor = torch.rand(1,3,32,32).to(device) # Random tensor for testing用

浏览 6提问于2021-06-09得票数 1

1回答

CuDNN已安装，但Tensorflow不能使用GPU

、、、

|-------------------------------+----------------------+----------------------+| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. || Processes:

浏览 2提问于2016-10-02得票数 0

回答已采纳

1回答

是否有类似的库推力(GPU并行STL )，但GPU* AMD Radeon？*

、、、

是否有类似的程序库( GPU的并行STL，它可以使用OpenMP/TBB，C++ CUDA)，但是对于(例如使用OpenCL而不是CUDA)？所需的标准STL-算法(排序，合并，删除/复制，如果，在/排他扫描，等等)，最优实现在GPU AMD Radeon并行在Win/*nix (AMP不适合)。

浏览 4提问于2013-08-19得票数 4

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

c++ AMP模板特异性限制

C++ AMP计算与WPF显卡双重使用性能

未来将存在哪些新的C++ AMP加速器？

C++Amp在构建/执行GPU之前是否需要GPU硬件？

将数据从GPU复制到CPU

删除指针数组GPU (动态分配)数据后，C++和GPU数据是不自由的

用C++-AMP实现面向对象编程

减少C++Amp中GPU-CPU数据传输

如果我已经在手动线程我的应用程序，我应该使用C++ AMP吗？

在GPU上运行MSIL

'cudart64_100.dll‘。TensorFlow要求将此DLL安装在%PATH%中指定的目录中

F#的C++ AMP库有用吗？

如何在CPU和GPU设备上同时运行任务？

简单图像处理示例中的C++AMP异常

C++安放在Tegra4 surface2上

PPL和AMP比序贯变换性能差

C++放大器:传输数据异步和在加速器上保存数据

混合精度学习，torch.cuda.amp运行速度比正常慢

CuDNN已安装，但Tensorflow不能使用GPU

是否有类似的库推力(GPU并行STL )，但GPU* AMD Radeon？*

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐