首页
学习
活动
专区
圈层
工具
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

挑战CUDA还需努力,AMD最新的ROCm 6.4版本仍未支持RDNA 4

AMD发布了ROCm 6.4版本,带来包括框架增强、更广泛的OS支持以及对多个性能和分析工具的改进。然而,它仍然缺乏对RDNA 4 GPU的支持,这可能会阻碍开发者转向AMD的最新架构。

ROCm是AMD的开源GPU编程平台,与Nvidia的CUDA生态系统竞争,用于为高性能计算(HPC)和人工智能(AI)应用提供动力。当RDNA 4上个月上市时,大家就期待ROCm能够第一时间实现兼容,AMD的AI软件副总裁也曾暗示过这一点。ROCm主要专注于AMD的MI Instinct加速器及其专业级Radeon Pro系列,但对消费级Radeon GPU的支持也在逐渐增加,只是速度没有CUDA那么快。

RDNA 4带来了一些架构改进,例如每个周期的FP16操作数量翻倍,INT4操作增加了8倍。此外,通过支持FP8,RDNA 4的性能可以比RDNA3的FP16能力提高8倍。没有官方的ROCm支持,这些改进实际上处于闲置状态。而且,讽刺的是,首次提到Navi 48(为RX 9070系列提供动力的GPU)可以追溯到去年的一个ROCm补丁。 

尽管如此,AMD在ROCm 6.4中做了很多改进:

支持CPX模式与NPS4内存模式。

支持PyTorch 2.6和2.5。

支持VP9,通过rocDecode/rocPyDecode实现。

对ROCm计算分析器进行了多项改进。

支持Oracle Linux 9和Radeon PRO W7800 GPU。

尽管AMD最近努力挑战CUDA的护城河,但其硬件支持始终落后于Nvidia。ROCm对消费级Radeon GPU在Windows上的支持始于2022年,现在几乎涵盖了RDNA 2和RDNA 3系列的所有GPU(不包括RX 7650 GRE和RX 7900 GRE),但不包括RX 6600到RX 6750 XT范围的HIP SDK支持。Linux方面的情况更加严峻,只兼容4款Radeon GPU。 

不过,也有好消息,现在可以在AMD的Strix Halo系列APU上使用ROCm,这些APU最多配备128GB内存,非常适合用于移动设备上的AI和HPC工作负载。AMD通常每月发布一次ROCm更新,因此我们可能会在下一个版本中看到对RDNA 4的支持。然而,这种不一致性可能会使开发者倾向于Nvidia,后者提供了更好且更可预测的兼容性。

  • 发表于:
  • 原文链接https://page.om.qq.com/page/OvER3Q7fFT0zDzxTCGfD2mlw0
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券