操作场景
本文介绍如何在 CVM 实例上配置 EFI(Elastic Fabric Interface,EFI),实现在 VPC 网络下体验超低延迟的 RDMA(Remote Direct Memory Access)功能。弹性 RDMA 网卡是一种可以绑定到 CVM 实例的虚拟网卡,EFI 必须依附于弹性网卡(ENI)开启 RDMA 设备。EFI 完全复用了弹性网卡所属的网络,让您无需改变业务组网,即可在原有网络下使用 RDMA 功能,体验 RDMA 带来的超低延迟。
EFI 相比于传统的 TCP 传输,提供更低的延迟和更高的吞吐量,能够提高实例间的通信性能,这对于扩展 HPC 和机器学习应用程序至关重要。弹性 RDMA 网卡 EFI 具有以下优势:
低延迟:RDMA 功能绕过操作系统直接读写远端服务器内存,极大地降低了 CPU 负载和延迟。EFI 使弹性网卡具有传统 RDMA 网卡的优点,您可以在腾讯云 CVM 中体验超低的延迟。
规模部署:传统的 RDMA 功能依赖于网络的无损特性,在规模部署时难度高且成本高。而 EFI 采用了自研的拥塞控制算法,容忍 CVM 网络中的延迟、丢包等问题,在有损的网络环境中依然可以有良好的性能表现。
弹性扩展:EFI 依附于弹性网卡,您可以随时创建支持 EFI 的弹性网卡并绑定到 CVM 实例,也可以随时解绑或删除该附属弹性网卡,轻松实现弹性扩展。
操作步骤
说明:
1. 创建支持 EFI 的 CVM 实例。
配置项 | 说明 |
地域及可用区 | 支持选择:北京-北京八区 |
实例族及类型 | 支持 EFI 的实例规格如下: 实例族:高性能计算集群 类型:GPU 型 HCCPNV5b |
镜像 | 支持镜像:Ubuntu 20.04 |
2. 您可以通过如下两种方式创建启用 EFI 的弹性网卡。
通过实例控制台创建并绑定启用 EFI 的弹性网卡。
ii. 单击目标实例,选择弹性网卡页签,单击绑定弹性网卡。
iii. 选择新建弹性网卡并绑定,打开弹性 RDMA 接口开关。
说明:
单台实例最多支持绑定一个启用 EFI 的辅助弹性网卡。
绑定辅助网卡至实例前,请确认目标实例的主网卡和辅助网卡不在同一子网内,否则可能因为默认路由导致辅助网卡的 RDMA 功能在某些情况下不可用。如果您知道如何解决并确定要这样使用,请忽略本提示。
若需要实现多个支持 EFI 的实例间通信,请保证不同实例的 EFI 弹性网卡在同 VPC 同子网内。


将启用 EFI 的辅助弹性网卡绑定至实例后,如需解绑,必须先停止压力,即停止实例内的通信操作。
iv. 单击确定。
通过私有网络控制台创建并绑定启用 EFI 的弹性网卡。
ii. 在左侧导航中选择 IP 与网卡 > 弹性网卡,进入弹性网卡列表页。
iii. 在上方选择地域和私有网络,单击新建。
iv. 在新建弹性网卡窗口输入名称,选择辅助弹性网卡的所属私有网络、子网后,为网卡分配 IP,打开弹性 RDMA 接口开关。


v. 单击确定。
vii. 单击目标实例,选择弹性网卡页签,单击绑定弹性网卡。
viii. 选择绑定已有弹性网卡,在列表中选择上述步骤中新建的弹性网卡。
说明:
单台实例最多绑定一个启用 EFI 的辅助弹性网卡。
绑定辅助网卡至实例前,请确认目标实例的主网卡和辅助网卡不在同一子网内,否则可能因为默认路由导致辅助网卡的 RDMA 功能在某些情况下不可用。如果您知道如何解决并确定要这样使用,请忽略本提示。
若需要实现多个支持 EFI 的实例间通信,请保证不同实例的 EFI 弹性网卡在同 VPC 同子网内。


ix. 单击确认。
3. 远程连接 CVM 实例。
4. 在实例内查看弹性网卡。
5. 在实例内安装 EFI 驱动。
5.1 下载驱动安装包,请联系您的商务经理以获取最新版本。
5.2 运行以下命令,解压安装包并进入文件目录。
tar -xvf vrdma_bundle.tgz && cd vrdma_bundle
5.3 运行以下命令,安装驱动。
sh install.sh
5.4 确认安装结果。
当出现如下信息时,表示安装成功。


如果提示安装失败,您可以按照错误指引进行相关操作后,尝试重新安装驱动。