作者简介:
郑浩,东南大学本科生,研究方向:OpenFlow,P4。
邮箱: zenhox@163.com
由于对SDN充满着兴趣,在学习了一段时间OpenFlow之后,一次偶然的机会接触到了P4。P4可以实现很多新的Idea,但是无奈于国内的实践资料太少了(有些资料似乎比较陈旧了)。唯一的学习来源是官网的英文实例教程,但是摸索起来很费时间。因此本人打算把自己的探索经验,写成一个专题,和大家分享,学习,交流。着重点是实践而非理论,有不正确的地方欢迎批评指正。
为什么要从理论上开始介绍呢?因为有了一些基础的理论概念,才能更好的去编程,不会摸不着头脑。无论大家对SDN的理解如何,我觉得都有必要把一些基础的概念,如:数据面,控制面等概念了解清楚,了解为什么要有P4,与OpenFlow的区别是什么等等。知道了这些,会提高我们的学习效率和质量。
SDN 与 OpenFlow
相信大家对SDN和OpenFlow都非常了解了。如果是这样,可以直接跳过这个部分,直接阅读下一节。
SDN的概念
SDN(Software Defined Network,软件定义网络)。 相对于传统网络,软件定义网络实现了控制平面与数据平面的分离,同时(至少在逻辑上)构建了一个集中的控制平面。人们可以在这个单一的控制平面上,实现对全网各个网元设备的监控,管理,编程。
OpenFlow
OpenFlow的诞生和历史不做赘述。OpenFlow在SDN中扮演怎样一个地位呢?我们先来看一张图片:
我们知道,SDN的一个重要概念就是控制平面和数据平面的分离,以及集中式的控制平面,这个集中的控制平面就是我们所说的控制器。那么控制平面与数据平面分离之后,如何像往常一样管理数据平面呢?因此,在分离后的控制平面和数据平面之间,只能通过一个特定的协议进行交互,这个协议就是我们的OpenFlow协议。也就是上图所示的1. Open interface to packet forwarding.
所以, OpenFlow协议有如下特点:
这张图放的有点早了,但是可以看到OpenFlow虽然实现了Target-independent,但是没有实现Protocol-independent。 这个是OpenFlow的最主要的缺陷之一,这也是引入P4的最主要的原因。什么是Protocol-independent呢?请继续看。
OpenFlow的缺陷
OpenFlow虽然为SDN奠定了基础。但是在进行应用开发的时候有一个很大的局限,就是OpenFlow没有真正做到协议不相关。也就是说,OpenFlow只能依据现有的协议来定义流表项。打个比方,就好像OpenFlow给了我们几个固定形状的积木,让我们自行组装,却不能让我们自己定义积木的形状。 这就是OpenFlow的局限所在!
举个例子:
OpenFlow 1.0 的时候有12个字段,这些字段分别就是我们熟悉的,IP地址,MAC地址,等等。但是很快发现,单单这12个字段不能满足现实网络世界中各种需求(在网络中的协议有很多种)。所以到OpenFlow1.3的时候字段增加到40个,现在OpenFlow1.5甚至更多。
这样带来的麻烦有很多,一是匹配效率和空间占用的问题。二是特定的OpenFlow交换机生产出来后,无法支持新的协议字段,只能在现有协议上进行开发。最终只能面临淘汰。
如果我们可以自定义协议字段的类型,甚至实现自定义动作的类型,那么我们就不需要反复修正协议本身,SDN的架构也将更加灵活。这个自定义协议字段类型,自定义动作类型就是我们所说的数据面编程。
数据面编程思想
数据面编程就是我们自己定义匹配字段,自己定义动作类型,从而自己定义流表,进而形成流水线(pipline)。基于这种初衷,P4应运而生。
什么是P4
P4(Programming Protocol-Independent Packet Processors)是一种数据面的高级编程语言。他可以克服OpenFlow的局限。通过P4语言,我们可以定义我们想要的数据面。进而再通过南向协议添加流表项。
P4 与 OpenFlow 的关联与区别
P4虽然弥补了OpenFlow的不足,但是P4和OpenFlow的定位是截然不同的! OpenFlow提供了一种控制器和数据面的动态交互的协议。是一种南向协议。而P4只是一个数据面的编程语言。
通过P4,我们可以定义各种各样形状的积木,而通过南向协议,我们可以组装这些积木来实现特定的功能。也就是说,写好P4代码并不是全部,我们还需要写相应的控制面代码才能使网络正常工作。
与OpenFlow对应的是P4 Runtime。 还记的上面的那张图吗,为了实现协议无关。P4的设计者们还提供了一个南向协议——P4 runtime。 P4 runtime与OpenFlow功能类似,但是P4 runtime可以充分利用P4协议无关的特性,”与P4更搭配!“。
P4中的那些事
P4是一种高级数据面编程语言,既然是高级语言,那么其设计本身就有着很高的抽象程度。我们先来看一种图:
这是P4中提供的最简单最易理解的编程结构,V1Model。可以看到它由5个模块组成,他们的名字分别是(从左到右):
P4为我们提供了上述抽象,我们就可以把所有的交换机理解为上述的模型,然后按照上述模型进行开发就可以了。所以,按照上述模型,P4语言的代码结构通常为这样:
在开始搭建环境和写P4代码前
p4 的github仓库 是学习P4编程的重要基地,我们着重了解一下几个子仓库:
上述几个仓库是学习过程中需要用到的,当然还有一些其他仓库,以后再介绍。
后话
第一次写文章,而且限于本人能力有限。难免有纰漏或者理解不当,还望各位谅解,如果能有批评指点,不胜感激!联系邮箱: zenhox@163.com