我正在用infiniband网络建立Linux集群,我是infiniband wolrd中的一个新手,任何建议都是非常受欢迎的!
我们目前正在使用Mellanox OFED驱动程序,但是我们的infiniband卡是旧的,并且没有被最新的MOFED驱动程序所识别。因此,我想知道为什么不使用发行版附带的驱动程序(运行CentOS7)。
这对使用这种或那种会有什么区别?我应该期待性能下降吗?
thx
发布于 2021-07-20 01:20:42
如果不使用供应商OFED发行版,在这种情况下,Mellanox不仅会导致性能损失,而且会缺少特性和许多稳定性问题。
Infiniband并不像以太网那样坚如磐石,Infiniband的主要目标是提供一种低延迟结构,而不仅仅是人们通常认为的高吞吐量网络。
收件箱驱动程序( Mellanox就是这样调用发行版上的OFED发行版)充其量是不可靠的,如果您运行的卡比Connect-X4还早,如果需要的话,您在运行IPoIB时会遇到困难,如果需要的话,仅仅保持启用它将最终导致内核恐慌。性能很差,网络也不可靠。
有一些替代,首先有MLNX的ED4.9,这是一个LTS发行版,支持老卡,如连接-X3。我会坚持它,因为它是支持的,并将被支持很长时间。
不同之处在于对以下硬件和技术的支持:
从这里下载:https://www.mellanox.com/products/infiniband-drivers/linux/mlnx_中的
如果Mellanox OFED的LTS版本不适合您,则另一种解决方案是迁移到Oracle Linux,采用UEK (牢不可破的企业内核)并使用其RDMA发行版。至少Oracle测试了这个OFED版本,他们的Exadata产品使用它。这里有可用的文档:https://docs.oracle.com/en/operating-systems/uek/6/relnotes6.2/ol_instav.html#uek6_安装_rdma
发布于 2022-04-29 17:41:37
“收件箱”驱动程序经历了Linux &A过程,而MOFED驱动程序则没有通过发行版Q&A。
MOFED中存在严重的错误,使我们的代码无法在MOFED下运行,并且在MOFED中已经禁用了对旧硬件的支持。但它适用于收件箱/地区司机。
MOFED是实验软件。如果系统偶尔崩溃一次,如果您想使用尚未成熟的尖端功能,则可能很有用。
https://serverfault.com/questions/1048740
复制相似问题