前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >NVIDIA A800和H800:算力超级搭档还是独自英雄?

NVIDIA A800和H800:算力超级搭档还是独自英雄?

作者头像
GPUS Lady
发布2023-07-08 15:10:41
2.9K0
发布2023-07-08 15:10:41
举报
文章被收录于专栏:GPUS开发者GPUS开发者

一早,群里有人问了一个问题:

我觉得这是个非常不错的问题,你基本上也可以将这个问题延申成:

我的机器里可以插一片RTX3080和一片RTX4090?

或者,

我的机器里可以插一片RTX卡和一片Tesla卡么?

那么A800和H800到底能不能组成算力超级战队呢?这个问题得从两个角度来看:

首先,我们来看它们在同一台机器上的耦合能力。

A800卡主打的就是互联能力,可以实现P2P访问和共享显存。两张A800卡通过P2P Access可以互联,互相借用和访问显存,没问题!可是历代的NV卡都不能跨计算能力版本进行P2P Access,所以A800和H800之间就无法互联了,失去了彼此互联和聚合显存的能力。这个互联能力可是A800的重要卖点呢!也是为什么A100卡不具备这个功能(因为它的互联速度太高了),所以才降速后变成A800卡。所以,如果混用A800和H800,它们就无法互联,失去了各自的特色,那可就没意义了。所以从这个角度来看,不建议混用这两种卡。

不过,如果是在同一台机器上组合使用,那还是有办法的。假设出于预算的原因,你先装了一张A800卡,然后等有了预算之后再加一张H800卡,这样是可以的。不过,编写程序的时候就需要注意不同计算能力的功能区别了。比如说,A800的计算能力只有8.0,每个SM内部都没有内置TMA这种DMA数据传输引擎,而H800可是有的哦!为了充分发挥两张卡的性能,得写不同版本的代码,针对不同的卡进行优化。当然,如果时间和预算有限,可能无法利用新卡的新功能特性,那就当做性能更高的旧卡来用好了。嘿嘿,虽然有点亏,但也是可以接受的。

至于跨机器的情况,比如说多台机器组成一个机架,依然可以混合使用A800和H800卡。这时候实际上就是一个应用软件的高层小集群啦,多台机器上同时跑一个虚拟的大分布式应用软件。这种情况下,用起来当然是没问题的。不过,在任务调度过程中可能会遇到一些麻烦。因为新卡可能更快,而旧卡在某些应用下可能相对慢一点。所以调度任务的能力就很重要了,得保持多张卡或多台机器之间的负载平衡,避免某些旧卡成为整个系统性能的瓶颈,嘿嘿,调度起来可是有点小麻烦呢。

而且要注意哦,这种多机器的组合通常用于分布式深度学习训练,这可是前面说到的应用的特例啊!很多人买回来就是为了组成多机器的大团队。在这种情况下,也许不需要用户自己写代码,只需选择一个强大的分布式训练框架就行了。嘿嘿,这个框架要能同时应对不同特性和性能的硬件配置,就得看框架本身了。

所以嘛,A800和H800到底能不能组成算力集群呢?在同一台机器上紧密耦合在一起的话,不建议混用哦!但是如果先上了一张A800,然后再有预算上一张H800,那是可以用起来的,只需注意编写不同版本的代码。而对于多台机器构成的机架,混合使用A800和H800也是可行的,只是在任务调度方面需要多加小心。总之,能用起来就好,但别让它们各自的特色和性能白白浪费啊!嘿嘿~

以上仅代表我们的观点,如果您有补充或者不同意见,欢迎留言,我们一起来探讨!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-06-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GPUS开发者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档