腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Matlab如何在CPU并行循环中实现
GPU
计算
?
、
、
我们能否通过使用
GPU
函数的parfor或spmd块的gpuArray来
计算
CPU的某些部分来提
高性能
呢?这是一种提
高性能
的合理方法,还是在此过程中存在局限性?我在某个地方读到,当我们有一些
GPU
单元时,我们可以使用这个程序。这是除了CPU并行循环之外,我们可以使用
GPU
计算
的唯一方法吗?
浏览 0
提问于2015-02-13
得票数 0
回答已采纳
2
回答
计算
优化实例与加速
计算
实例的区别
、
我刚接触过AWS,遇到了这两种情况,但我不明白它们之间有什么区别--它们看起来是一样的--有人能解释这一点吗加速
计算
实例使用硬件加速器或协处理器,以比在CPU上运行的软件更有效地执行某些功能这些函数的例子包括浮点数
计算
、图形处理和数据模式匹配.对于从
高性能
处理器中受益的
计算
绑定应用程序来说,
计
浏览 5
提问于2021-09-11
得票数 0
1
回答
什么是
GPU
实例,它与标准实例有什么不同?
、
、
我已经读到了很多关于团结5.4中的新特性的辩论:
GPU
实例。我理解在一般情况下的重要性,无论是在节省内存和吸引电话方面。然而,即使在阅读了一些之后,我仍然无法理解
GPU
实例和非
GPU
实例之间究竟有什么不同,更重要的是,所谓的
GPU
在性能方面的优势来自哪里。 谢谢你的知识和任何参考资料。
浏览 0
提问于2016-05-29
得票数 1
回答已采纳
1
回答
集群内
GPU
的常见拓扑是什么?
、
、
我是
高性能
计算
领域的新手,正在学习
GPU
卡的Allreduce操作。我发现了一种称为ring-Allreduce的高效集合操作,它要求
GPU
卡的物理拓扑为树型拓扑。
GPU
卡似乎是通过多条本地PCIe总线和PCIe主桥连接在一起的。是总线拓扑的层次结构吗?
浏览 30
提问于2020-02-13
得票数 0
回答已采纳
1
回答
在Java程序中签入安装了什么
GPU
、
我正在编写一个使用外部C++ .exe应用程序的Java程序: 如何在我的Java应用程序中签入在当前
计算
机上安装了什么
GPU
(以便应用程序知道要运行哪个外部.exe )? 不,我不想做Java
GPU
编程。
浏览 2
提问于2014-03-16
得票数 0
1
回答
CPU-
GPU
触发器率
、
、
、
、
我需要
计算
每一个代码应该提供多少个失败值,这样在
GPU
上运行代码就足以提
高性能
。1。PCIe 16xv3.0总线能够以15.75GB/s的速度将数据从CPU传输到
GPU
。3。CPU能够执行400单精度GFLOPs/秒。5。
计算
可能与数据传输重叠。 6。数据最初放在CPU中。
浏览 2
提问于2016-02-25
得票数 1
1
回答
如何在
高性能
计算
中安装H2O无人驾驶AI?
、
、
有没有关于如何在
高性能
计算
(HPC)环境中安装/设置无人驾驶AI的文档,以便我可以请求几个节点(每个节点都有
GPU
)并让DAI利用它?
浏览 13
提问于2019-09-26
得票数 0
回答已采纳
1
回答
双
GPU
中的内存使用(多
GPU
)
、
、
我正在使用两个配置相同的
GPU
作为我的
高性能
GPU
计算
使用OpenCL。其中一个卡是为显示目的连接的,两个程序compiz和x服务器总是使用大约200-300 MB的内存。我的问题是,当使用这些
GPU
进行
计算
时,我只能使用
GPU
中的部分内存,用于显示目的,而第二个
GPU
则可以使用整个全局内存。在显示
GPU
的情况下,我只能使用128 MB进行
计算
,而其他的则可以使用完整的503 MB进行
计算
。 根据页
浏览 7
提问于2016-06-02
得票数 0
9
回答
是否有可能在AMD
GPU
上运行CUDA?
、
、
、
、
我想把我的技能扩展到
GPU
计算
。我熟悉光线跟踪和实时图形(OpenGL),但下一代图形和
高性能
计算
似乎是在
GPU
计算
或类似的东西。 我目前在我的家庭电脑上使用AMD HD 7870显卡。第二个更普遍的问题是,我从什么地方开始
GPU
计算
?我确信这是一个经常被问到的问题,但我看到的最好的是从08年开始,我认为自那以后这个领域发生了很大的变化。
浏览 27
提问于2012-10-10
得票数 107
回答已采纳
1
回答
为什么这些粒子在使用CSS3图形处理器变换时速度较慢?
、
、
我的猜测是,对CSS的每次更改都需要重新
计算
样式,当元素不被发送到
GPU
时,重新
计算
样式的开销会更低。有没有一种方法可以在不重新
计算
样式的情况下完成我需要的动态转换?有没有办法使用
GPU
来提
高性能
?
浏览 2
提问于2013-07-09
得票数 1
回答已采纳
2
回答
使用
GPU
并行处理和绘制数字
、
、
、
、
(在OpenCL上)在同一个
GPU
上有效地共享?例如, 谢谢
浏览 3
提问于2013-10-01
得票数 0
1
回答
Python:将
计算
卸载到
GPU
、
、
我发现Activity列出了这些脚本不需要
高性能
GPU
,即使我的机器有一个(NVIDIA GeForce GT 750 M 2048 MB)。Paraview (基于VTK)被列为需要
高性能
GPU
。问题:如何使我的脚本从
高性能
GPU
中获益?剧本里有什么我应该设置的吗?
浏览 6
提问于2016-08-04
得票数 1
1
回答
带有ArrayFire的多个主机线程
、
、
我们希望通过使用ArrayFire在单个
GPU
上执行矩阵乘法来提
高性能
。我很难找到答案,因为我不太精通
GPU
计算
语言。我的印象是某些
GPU
支持并发内核执行,但我无法确定我们的
GPU
(Radeon 10)是否支持。 任何关于如何使用ArrayFir
浏览 3
提问于2018-01-11
得票数 2
回答已采纳
4
回答
在
GPU
上运行操作系统内核级
计算
有意义吗?
、
、
我注意到一个
GPU
可以有数百个内核,这样可以大大加快并行
计算
的速度。在操作系统内核中,似乎没有并行算法用于加速。 人们在用户中进行并行
计算
的速度与OpenMP相同,但为什么不在内核空间中进行呢?那么,为什么OSes不使用
GPU
来提
高性能
和吞吐量呢?在
GPU
上运行操作系统
计算
有意义吗?
浏览 3
提问于2011-03-09
得票数 14
回答已采纳
2
回答
如何强制exe文件在windows上的Nvidia
GPU
上运行
、
、
我需要做非常复杂的
计算
,在正常的CPU上,我的代码大约需要3个月才能完成执行。这就是为什么我试图在我的Nvidia
GPU
上运行这个程序。代码是在上开发的,我创建了一个EXE文件。这就是我想做的:两种方法都失败了,我的代码运行在我的英特尔
GPU</em
浏览 8
提问于2022-03-04
得票数 1
回答已采纳
1
回答
Tensorflow上的训练更改输入大小RNN
、
、
、
、
在
GPU
上运行同样的东西是否有用,或者我正在做一些逻辑上的错误?
浏览 0
提问于2018-04-17
得票数 0
1
回答
Three.js,什么是改变顶点位置的最有效的方法?
、
、
、
、
我是Three.js的新手,我用了两种方法来移动平面的顶点。我想知道,在性能方面,还是在最佳实践方面,应该使用这两种方法中的哪一种。演示:使用vertexShader: vUv = uv; vec3 newPosition = position; newPosition.z = n
浏览 9
提问于2021-05-01
得票数 1
回答已采纳
1
回答
Azure NCv3和NC T4_v3有什么区别?
、
尽管有一种解释"The NC 3-系列和NC T4 _v3系列的尺寸是为
计算
密集型的
GPU
加速应用程序优化的,一些例子是基于CUDA和基于OpenCL的应用程序和仿真、人工智能和深度学习。NC T4 v3-系列的重点是基于NVIDIA的Tesla T4
GPU
和AMD EPYC2罗马处理器的推理工作负载。NC 3系列专注于
高性能
计算
和以NVIDIA的NC U.为特色的AI工作负载。
浏览 5
提问于2022-10-14
得票数 0
1
回答
使用数据表运行100,000个Fisher的确切测试比应用慢
、
、
、
早上好,我尝试使用数据表对融化的,整洁的数据,其中包含大约200,000,000行和四列(主题ID,疾病状态,位置和“值”野生型等位基因的数目,一个3因素变量)。该函数按位置分组,然后对疾病的值进行Fisher精确检验。 ident disease position value2: 2 0
浏览 4
提问于2015-01-27
得票数 2
1
回答
R:对于大的时间序列,有没有快速的近似相关库?
、
我正在尝试制作一个软件,它将实时找到前N个相关的时间序列窗口(查询序列)。目前我正在使用cor函数,但它被证明太慢了。我需要一秒以下的响应时间。低于250ms就很好了,但是在这个范围内的任何东西都可以。如果没有,有没有其他方法可以稍微缩小这个列表?GetTopN<-function(n) Rprof() x<-as.dat
浏览 0
提问于2012-02-15
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
GPU推动遥感数据高性能计算研究取得进展
GPU 高性能计算,加速脑与认知科学发展
创新加速:国产GPU集群,助力高性能计算迈向新高度!
GPU 高性能推理加速框架Forward开源啦
英伟达确认:2024年推出Hopper-Next GPU,专注高性能计算和人工智能领域
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券