腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
c++
AMP
模板特异性限制
、
、
#include <
amp
.h> { class Process publicI want operator() to be restrict(
amp
) if DataToProcess is Data::
GPU
and restrict(cpu) if DataToProcess时,它需要限制(
Amp
)。我在
AMP
文档中看到有一天会出现一个限制(Au
浏览 3
提问于2015-03-11
得票数 1
1
回答
C++
AMP
计算与WPF显卡双重使用性能
、
、
、
、
情况:我将能够,并将分别衡量
AMP
的性能,因为它是低水平和新的功能,我将设置在一个单独的项目无论如何。WPF呈现部分已经存在于一个复杂的应用程序中,因此很难隔离它。
浏览 2
提问于2014-03-01
得票数 2
1
回答
未来将存在哪些新的C++
AMP
加速器?
我一直在学习C++
AMP
,我所看到的一切都强调
AMP
在“加速器”上工作,而不仅仅是
GPU
。我认为,今天,所有的加速器都是
GPU
,但未来可能会有不同类型的加速器。那么,还有什么可以成为加速器呢?是现在正在开发新的加速器,还是
AMP
只是试图成为未来的证明?
浏览 0
提问于2012-09-10
得票数 4
回答已采纳
1
回答
C++
Amp
在构建/执行
GPU
之前是否需要
GPU
硬件?
、
在从一个了解到,我的VS 2017 C++
AMP
项目基本上是健全的,错误信息虽然正确但掩盖了真正的问题,问题是某些代码行,我重写了下面的代码。这让我不禁要问:并发运行时或C++
AMP
是否需要安装
GPU
硬件才能正确构建和/或执行?我的机器有两个多核CPU处理器,但
GPU
硬件还没有安装.尽管如此,我仍然认为我可以使用并行结构来利用我拥有的处理器。#include "pch.h"#include "
amp
.h&qu
浏览 1
提问于2019-01-23
得票数 1
回答已采纳
2
回答
将数据从
GPU
复制到CPU
3000x3000的数组,并将计算过程重复20000次: extent<2> ext(_height,_width); array<int, 2>
GPU
_res(ext,gpuDevice.default_view); array_view<
浏览 0
提问于2012-12-19
得票数 4
回答已采纳
1
回答
删除指针数组
GPU
(动态分配)数据后,C++和
GPU
数据是不自由的
#include "stdafx.h" #include <assert.h> dest.discard_data(); {delete P_
GPU
; // the DATA
浏览 4
提问于2014-09-26
得票数 0
1
回答
用C++-
AMP
实现面向对象编程
为了使用
GPU
实现算法,我需要更新一些用于算法的代码。然而,代码严重依赖于面向对象的编程模型.我的问题是,是否有可能将对象传递给parallel for each?C++-
AMP
是我在
GPU
编程中使用的第一种语言.因此,我在这个领域的经验是有限的。
浏览 0
提问于2013-11-04
得票数 2
回答已采纳
1
回答
减少C++
Amp
中
GPU
-CPU数据传输
、
、
、
、
在使用C++
Amp
优化应用程序时,我遇到了以下问题:数据传输。对我来说,将数据从CPU复制到
GPU
没有问题(因为我可以在应用程序的初始状态下这样做)。更糟糕的是,我需要快速访问C++
Amp
内核计算的结果,所以
GPU
和CPU之间的瓶颈是痛苦的。我读到在Windows8.1下有一个性能提升,但是我使用的是Windows 7,我不打算改变它。tile<_tile_size>(), [=, &a, &a_partial_result] (concurrency::tiled_index<_tile
浏览 4
提问于2014-02-19
得票数 4
回答已采纳
2
回答
如果我已经在手动线程我的应用程序,我应该使用C++
AMP
吗?
我不知道C++
AMP
有什么好处。如果我已经多线程了我的应用程序(在本例中是射线追踪器)来使用系统上的所有n个核,我应该使用C++
AMP
吗,或者这实际上会产生更多的瓶颈吗?
浏览 5
提问于2012-10-11
得票数 1
回答已采纳
3
回答
在
GPU
上运行MSIL
、
、
、
、
也许这是一个疯狂的问题,但有可能在
GPU
上运行线程吗? 我问的原因是我有一些相当复杂的计算要执行(主要是数学和数组),我想看看我是否可以使用
GPU
在速度上有所提高。
浏览 1
提问于2011-10-19
得票数 15
回答已采纳
1
回答
'cudart64_100.dll‘。TensorFlow要求将此DLL安装在%PATH%中指定的目录中
、
、
我正在尝试使用神经网络,但在导入Tensorflow时遇到问题。几个月前,它工作得很好。我想我一直在试图在没有显卡的情况下访问我的显卡,或者至少没有访问它。目前,错误是这样的: >>> import tensorflow OSError Traceback (most recent call last) ~\AppData\Roaming\Python\P
浏览 101
提问于2020-04-09
得票数 0
回答已采纳
1
回答
F#的C++
AMP
库有用吗?
、
、
、
我正在试验F#中的
GPU
库,以此作为使用C++并行工作的一种方式。然而,我得到的结果似乎并不直观。a view over the data on the CPU }); dataView.synchron
浏览 0
提问于2012-12-24
得票数 5
回答已采纳
1
回答
如何在CPU和
GPU
设备上同时运行任务?
、
因此,我希望做到以下几点: int numberOfTasks = 1000; // RunTasksAMP(start,end) sends a rest
浏览 0
提问于2013-11-05
得票数 5
回答已采纳
1
回答
简单图像处理示例中的C++
AMP
异常
、
、
、
、
我试着教自己C++
AMP
,我想从我的领域开始一个非常简单的任务,那就是图像处理。我想把每像素24位的RGB图像(位图)转换成每像素8位的灰度图像。我知道C++
AMP
由于某些原因不能通过array或array_view处理char或unsigned char数据,所以我尝试根据使用textures。到目前为止,我使用的代码是:
gpu
::grap
浏览 1
提问于2014-03-19
得票数 1
回答已采纳
1
回答
C++安放在Tegra4 surface2上
、
、
、
我正在尝试移植一个C++
AMP
应用程序,以便在Surface 2平板上运行。由于C++
AMP
在平板电脑上使用WinRT,而且它使用DirectX加速
GPU
,而且Tegra处理器确实与DirectX一起工作,所以我希望在平板上使用C++
AMP
而不是使用"cpu“来提高性能。我在桌面上看到了大约80x的加速,与使用单个CPU内核相比,在
GPU
上使用相同的代码,而且高度并行。 事实证明,平板电脑上的
AMP
解决方案只会给我带来Tegras四核的好处,但仅此而已。我有三个C++ <
浏览 2
提问于2014-03-02
得票数 2
回答已采纳
1
回答
PPL和
AMP
比序贯变换性能差
、
、
、
、
我编写了以下简短的测试代码来测试C++
AMP
和std::transform的顺序STL实现的PPL库的性能。令我惊讶的是,C++
AMP
和PPL实现都明显不如顺序实现(C++
AMP
: 128 my,PPL: 51 my,顺序:25 my)。这种模式适用于int、float和double数据类型。对于较小的大小(可能少于几千),我预计顺序代码将是最快的,因为将数据从CPU复制到
GPU
有很大的时间延迟,而对于PPL来说,线程启动等方面会有轻微的延迟,但是我并不认为大尺寸(100000+)的顺序代码会获胜我在Visual 2013
浏览 0
提问于2014-07-05
得票数 2
回答已采纳
1
回答
C++放大器:传输数据异步和在加速器上保存数据
、
、
、
显然,每个调用都必须将#1复制到
GPU
上。为此,我使用了一个堆栈管理的const array<>,它工作得很好。 对于#2,最优的情况是将向量保留在
GPU
内存中,因为它是常量的。这能用安培吗?对于#3,是否可以在
GPU
上分配缓冲区并将其复制回来,而不是在cpu堆栈上创建一个空缓冲区,复制它,并在结果写入它之后将它复制回来?最后一件事,因为本质上的parallel_for_each调用是异步的,并且将由#3或array_view::synchronize()的析构函数同步,那么是否有可能离开当前函数(和堆栈空间),在
GPU
浏览 2
提问于2014-08-26
得票数 2
1
回答
混合精度学习,torch.cuda.
amp
运行速度比正常慢
、
、
、
但是,我想在推断的同时获得更快的结果,所以我只在运行测试推理用例时启用了torch.cuda.
amp
.autocast()函数。model normallytensor = torch.rand(1,3,32,32).to(device) # Random tensor for testing用
浏览 6
提问于2021-06-09
得票数 1
1
回答
CuDNN已安装,但Tensorflow不能使用
GPU
、
、
、
|-------------------------------+----------------------+----------------------+| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage |
GPU
-Util Compute M. || Processes:
浏览 2
提问于2016-10-02
得票数 0
回答已采纳
1
回答
是否有类似的库推力(
GPU
并行STL ),但
GPU
AMD Radeon?
、
、
、
是否有类似的程序库(
GPU
的并行STL,它可以使用OpenMP/TBB,C++ CUDA),但是对于(例如使用OpenCL而不是CUDA)?所需的标准STL-算法(排序,合并,删除/复制,如果,在/排他扫描,等等),最优实现在
GPU
AMD Radeon并行在Win/*nix (
AMP
不适合)。
浏览 4
提问于2013-08-19
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Oracle中如何插入特殊字符:&amp;amp;和&amp;#39
忘不了的 TODOS&amp;FIXMES&amp;ERRORS
MacOS部署AMP环境
Google的AMP问题
网页加速特技之 AMP
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券