操作场景
本文档介绍如何通过 DPDK 方法进行云服务器高吞吐网络性能测试。
操作步骤
编译安装 DPDK
- 准备2台测试机器,请参见 自定义配置 Linux 云服务器 购买测试机器。本文测试机器使用 CentOS 8.2 操作系统。
- 依次登录测试机器,并执行以下命令下载 DPDK 工具。如何登录云服务器,请参见 使用标准登录方式登录 Linux 实例(推荐)。
yum install -y sysstat wget tar automake make gcc
wget http://git.dpdk.org/dpdk/snapshot/dpdk-17.11.tar.gz
tar -xf dpdk-17.11.tar.gz
mv dpdk-17.11 dpdk
- 修改 txonly 引擎,使每个 DPDK 发包 CPU 上的 UDP 流量的端口变动产生多条流。
- 执行以下命令,修改
dpdk/app/test-pmd/txonly.c
文件。
按 i 进入编辑模式,修改以下内容:vim dpdk/app/test-pmd/txonly.c
- 找到
#include "testpmd.h"
,另起一行输入如下内容:
修改完成后,如下图所示:RTE_DEFINE_PER_LCORE(struct udp_hdr, lcore_udp_hdr);
- 找到
ol_flags |= PKT_TX_MACSEC;
,另起一行输入如下内容:
修改完成后,如下图所示:/* dummy test udp port */ static uint16_t test_port = 0; test_port++; memcpy(&RTE_PER_LCORE(lcore_udp_hdr), &pkt_udp_hdr, sizeof(pkt_udp_hdr)); RTE_PER_LCORE(lcore_udp_hdr).src_port = rte_cpu_to_be_16(rte_lcore_id() * 199 + test_port % 16); RTE_PER_LCORE(lcore_udp_hdr).dst_port = rte_cpu_to_be_16(rte_lcore_id() * 1999 + test_port % 16);
- 找到
copy_buf_to_pkt(&pkt_udp_hdr, sizeof(pkt_udp_hdr), pkt,
,将其替换为如下内容:
修改完成后,如下图所示:copy_buf_to_pkt(&RTE_PER_LCORE(lcore_udp_hdr), sizeof(RTE_PER_LCORE(lcore_udp_hdr)), pkt,
按 Esc 输入 :wq 保存修改并退出。
- 找到
- 执行以下命令,修改
dpdk/config/common_base
文件。
按 i 进入编辑模式,找到vim dpdk/config/common_base
CONFIG_RTE_MAX_MEMSEG=256
,将其修改为1024。修改完成后如下图所示:
按 Esc 输入 :wq 保存修改并退出。说明接受及发送端机器均需修改以上配置文件,您可使用以下命令,将修改完成的文件发送至对端,避免重复修改。
scp -P 22 /root/dpdk/app/test-pmd/txonly.c root@<IP地址>:/root/dpdk/app/test-pmd/ scp -P 22 /root/dpdk/config/common_base root@<IP地址>:/root/dpdk/config
- 执行以下命令,修改
- 执行以下命令,将
dpdk/app/test-pmd/txonly.c
的 IP 地址修改为测试机器所用 IP。
按 i 进入编辑模式,找到如下内容:vim dpdk/app/test-pmd/txonly.c
将数字198、18、0、1替换为机器 IP,SRC_ADDR 为发送端 IP,DST_ADDR 为接收端 IP。#define IP_SRC_ADDR (198U << 24) | (18 << 16) | (0 << 8) | 1; #define IP_DST_ADDR (198U << 24) | (18 << 16) | (0 << 8) | 2;
- 对应机器操作系统,执行以下命令,安装 numa 库。
- 在
dpdk/
目录下执行以下命令,关闭 KNI。sed -i "s/\(^CONFIG_.*KNI.*\)=y/\1=n/g" ./config/*
- 若您的操作系统内核版本较高(例如5.3),则请执行以下命令,屏蔽差异。
sed -i "s/\(^WERROR_FLAGS += -Wundef -Wwrite-strings$\)/\1 -Wno-address-of-packed-member/g" ./mk/toolchain/gcc/rte.vars.mk
sed -i "s/fall back/falls through -/g" ./lib/librte_eal/linuxapp/igb_uio/igb_uio.c
- 执行以下命令,编译 DPDK。
make defconfig
make -j
配置大页内存
执行以下命令,配置大页内存。
echo 2048 > /sys/kernel/mm/hugepages/hugepages-2048kB/nr_hugepages
若出现报错信息,则说明大页内存不足,可调整命令配置。例如:echo 4096 > /sys/kernel/mm/hugepages/hugepages-2048kB/nr_hugepages
装载内核模块及绑定接口
说明该步骤需使用 Python,请前往 Python 官网 下载并安装所需版本。本文以 Python 3.6.8 为例。
- 切换登录方式为 使用 VNC 登录 Linux 实例。由于将网卡驱动绑定至 igb_uio 用户态驱动后,该网卡将无法通过 ssh 或 IP 访问,仅支持通过 VNC 或 console 方式访问。
- 依次执行以下命令,装载 UIO 模块及绑定 virito 接口。
ifconfig eth0 0
ifconfig eth0 down
modprobe uio
insmod /root/dpdk/build/kmod/igb_uio.ko
cd /root/dpdk/usertools/
python3 dpdk-devbind.py --bind=igb_uio 00:05.0
说明命令中的 00.05.0 为示例地址,请执行以下命令,获取网卡实际地址。
python3 dpdk-devbind.py -s
cd /root/dpdk/usertools/
python3 dpdk-devbind.py --bind=virtio-pci 00:05.0
ifconfig eth0 up
测试带宽及吞吐量
说明
- 测试命令通过 txpkts 参数控制发包大小,测试带宽使用1430B,测试 pps 使用64B。
- 此步骤的命令参数适用于 CentOS 8.2 操作系统。若使用其他系统镜像版本,则需结合实际场景调整参数后重新测试。例如,CentOS 7.4 内核版本为3.10,与 CentOS 8.2 的内核版本4.18存在性能差异,可将带宽测试命令中的
nb-cores
修改为2。关于命令参数的更多信息,请参见 estpmd-command-line-options。
- 执行以下命令,发送端采用 TX only 模式启动 testpmd, 接收端启用 rxonly 模式。
- 发送端:
/root/dpdk/build/app/testpmd -- --txd=128 --rxd=128 --txq=16 --rxq=16 --nb-cores=1 --forward-mode=txonly --txpkts=1430 --stats-period=1
- 接收端:
/root/dpdk/build/app/testpmd -- --txd=128 --rxd=128 --txq=48 --rxq=48 --nb-cores=16 --forward-mode=rxonly --stats-period=1
- 发送端:
- 执行以下命令,测试 pps(UDP 64B 小包)。
- 发送端:
/root/dpdk/build/app/testpmd -- --txd=128 --rxd=128 --txq=16 --rxq=16 --nb-cores=3 --forward-mode=txonly --txpkts=64 --stats-period=1
- 接收端:
得出如下图所示测试结果:/root/dpdk/build/app/testpmd -- --txd=128 --rxd=128 --txq=48 --rxq=48 --nb-cores=16 --forward-mode=rxonly --stats-period=1
- 发送端:
网络带宽计算
可根据接收端 PPS 和测试包长来计算当前网络的接收带宽,公式如下:
PPS × packet length × 8bit/B × 10-9 = 带宽
结合测试得出数据,可得当前带宽为:
4692725pps × 1430B × 8bit/B × 10-9 ≈ 53Gbps
说明
- 报文长度1430B,包含14B以太网头、8B CRC 以及20B IP 头。
- 测试结果中 Rx-pps 为瞬时统计值,您可多次测试求其平均值,得到更准确的结果。