外部网关路由协议 BGP
[TOC]
BGP概述 OSPF、IS-IS等IGP路由协议在组织机构网络内部广泛应用,随着网络规模扩大,网络中路由数量不断增长,IGP已无法管理大规模网络,AS的概念由此诞生。
AS指的是在同一个组织管理下,使用统一选路策略的设备集合
不同AS通过AS号区分,AS号存在16bit、32bit两种表示方式。IANA负责AS号的分发。
IANA(Internet Assigned Numbers Authority,因特网地址分配组织):IAB(Internet Architecture Board,因特网体系委员会)的下设组织。IANA授权NIC( Network Information Center,网络信息中心)和其他组织负责IP地址和域名分配,同时,IANA负责维护TCP/IP协议族所采用的协议标识符数据库,包括自治系统号。
在长度为16bit的AS号表示方式中:64512-65534为私有AS号,在长度为32bit的AS号表示方式中:4200000000-4294967294为私有AS号。
使用IGP——内部网关协议 传递路由: AS之间需要直连链路,或通过VPN协议构造逻辑直连进行邻居建立
AS之间可能是不同的机构、公司,相互之间无法完全信任,使用IGP可能存在暴露AS内部的网络信息的风险 整个网络规模扩大,路由数量进一步增加,路由表规模变大,路由收敛变慢,设备性能消耗加大
使用BGP传递路由: AS之间专门使用BGP(Border Gateway Protocol,边界网关协议)协议进行路由传递,相较于传统的IGP协议有以下优点 :
BGP基于TCP,只要能够建立TCP连接即可建立BGP 只传递路由信息,不会暴露AS内的拓扑信息 触发式更新,而不是进行周期性更新 BGP在企业中的应用 BGP的基本概念 BGP是一种实现自治系统AS之间的路由可达,并选择最佳路由的矢量性协议
早期发布的三个版本分别是BGP-1、BGP-2和BGP-3,1994年开始使用BGP-4,2006年之后单播IPv4网络使用的版本是BGP-4,其他网络使用的版本是MP-BGP BGP的特点: BGP使用TCP作为其传输层协议(端口号为179),使用触发式路由更新,而不是周期性路由更新 BGP能够承载大批量的路由信息,能够支撑大规模网络 BGP提供了丰富的路由策略,能够灵活的进行路由选路,并能指导对等体按策略发布路由 BGP能够支撑MPLS/VPN的应用,传递客户VPN路由 BGP提供了路由聚合和路由衰减功能用于防止路由振荡,通过这两项功能有效地提高了网络稳定性 BGP特征: BGP使用TCP为传输层协议,TCP端口号179。路由器之间的BGP会话基于TCP连接而建立 运行BGP的路由器被称为BGP发言者(BGP Speaker),或BGP路由器 两个建立BGP会话的路由器互为对等体(Peer),BGP对等体之间交换BGP路由表 BGP路由器只发送增量的BGP路由更新,或进行触发式更新 BGP能够承载大批量的路由前缀,可在大规模网络中应用 BGP通常被称为路径矢量路由协议(Path-Vector Routing Protocol) 每条BGP路由都携带多种路径属性(Path attribute),BGP可以通过这些路径属性控制路径选择,而不像IS-IS、OSPF只能通过Cost控制路径选择,因此在路径选择上,BGP具有丰富的可操作性,可以在不同场景下选择最合适的路径控制方式。 BGP对等体关系 两个建立BGP会话的路由器互为对等体(Peer),BGP对等体之间交换BGP路由表
BGP对等体关系建立 先启动BGP的一端先发起TCP连接,如图所示,R1先启动BGP,R1使用随机端口号向R2的179端口发起TCP连接,完成TCP连接的建立
三次握手建立完成之后,R1、R2之间相互发送Open报文,携带参数用于对等体建立,参数协商正常之后双方相互发送Keepalive报文,收到对端发送的Keepalive报文之后对等体建立成功,同时双方定期发送Keepalive报文用于保持连接
其中Open报文中携带:
My Autonomous System:自身AS号 Hold Time:用于协商后续Keepalive报文发送时间 BGP Identifier:自身Router ID BGP对等体关系建立之后,BGP路由器发送BGP Update(更新)报文通告路由到对等体。
BGP建立对等体的对等体都会发起TCP三次握手,所以会建立两个TCP连接,但是实际BGP只会保留其中一个TCP连接,从Open报文中获取对端BGP Identifier之后BGP对等体会比较本端的Router ID和对端的Router ID大小,如果本端Router ID小于对端Router ID,则会关闭本地建立的TCP连接,使用由对端主动发起创建的TCP连接进行后续的BGP报文交互
TCP连接源地址 缺省情况下,BGP使用报文出接口作为TCP连接的本地接口,在部署IBGP对等体关系时,建议使用Loopback地址作为更新源地址
Loopback接口非常稳定,而且可以借助AS内的IGP和冗余拓扑来保证可靠性 在部署EBGP对等体关系时,通常使用直连接口的IP地址作为源地址,如若使用Loopback接口建立EBGP对等体关系,则应注意EBGP多跳问题 一般而言在AS内部,网络具备一定的冗余性。在R1与R3之间,如果采用直连接口建IBGP邻居关系,那么一旦接口或者直连链路发生故障,BGP会话也就断了,但是事实上,由于冗余链路的存在,R1与R3之间的IP连通性其实并没有DOWN
BGP报文及状态机 BGP报文类型: BGP存在5种类型的报文,不同类型的报文拥有相同的头部(header)
不同于常见的IGP协议,BGP使用TCP作为传输层协议,端口号179 ,这使得BGP支持在非直连的路由器之间建立对等体关系
BGP对等体关系建立之后有路由需要发送或路由变化时向对等体发送Update报文
当BGP在运行中发现错误时,发送Notification报文将错误通告给BGP对等体
BGP路由器收到对端发送的Keepalive报文,将对等体状态置为已建立,同时后续定期发送keepalive报文用 于保持连接
用于在改变路由策略后请求对等体重新发送路由信息。只有支持路由刷新能力的BGP设备会发送和响应此报文
BGP报文格式: BGP报文格式 - 报文头格式 BGP五种报文都拥有相同的报文头,格式如左侧所示,主要字段解释如下:Marker:16Byte,用于标明BGP报文边界,所有bit均为“1” Length:2Byte,BGP报文总长度(包括报文头在内),以Byte为单位 Type:1Byte,BGP报文的类型。其取值从1到5,分别表示Open、Update、Notification、Keepalive和Route-refresh 报文 BGP报文格式 - Open Open报文是TCP连接建立之后发送的第一个报文,用于建立BG对等体之间的连接关系 ,报文格式如左侧所示,主要字段解释如下:Version:BGP的版本号。对于BGP 4来说,其值为4 My AS autonomous system:本地AS号。通过比较两端的AS号可以判断对端是否和本端处于相同AS Hold Time:保持时间。在建立对等体关系时两端要协商Hold Time,并保持一致。如果在这个时间内未收到对端发来的Keepalive报文或Update报文,则认为BGP连接中断 BGP Identifier:BGP标识符,以IP地址的形式表示,用来识别BGP路由器 Opt Parm Len:Optional parameters的长度 Optional parameters:宣告自身对于一些可选功能的支持,比如认证、多协议支持,除了IPv4单播路由信息,BGP4+还支持多种网络层协议,在协商时BGP对等体之间会通过 Optional_parameters字段协商对网络层协议的支持能力 BGP报文格式 - Update Update报文用于在对等体之间传递路由信息,可以用于发布、撤销路由 一个Update报文可以通告具有相同路径属性的多条路由,这些路由保存在NLRI(Network Layer Reachable Information,网络层可达信息)中。同时Update还可以携带多条不可达路由,用于告知对方撤销路由,这些保存在Withdrawn Routes字段中。 报文格式如左侧所示,主要字段解释如下:Withdrawn routes:不可达路由的列表 Path attributes:与NLRI相关的所有路径属性列表,每个路径属性由一个TLV(Type-Length-Value)三元组构成 NLRI:可达路由的前缀和前缀长度二元组 Unfeasible routes length:不可达路由字段的长度,以Byte为单位。如果为0则说明没有Withdrawn Routes 字段 Withdrawn Routes Length:标明Withdrawn Routes部分的长度。其值为零时,表示没有撤销的路由 Total path attribute length:路径属性字段的长度,以Byte为单位,如果为0则说明没有Path Attributes 字段 BGP报文格式 - Notification 当BGP检测到错误状态时(对等体关系建立时、建立之后都可能发生),就会向对等体发送Notification,告知对端错误原因。之后BGP连接将会立即中断Error Code、Error subcode:差错码、差错子码,用于告知对端具体的错误类型 Data:用于辅助描述详细的错误内容,长度并不固定 BGP报文格式 - Keepalive BGP路由器收到对端发送的Keepalive报文,将对等体状态置为已建立,同时后续定期发送keepalive报文用于保持连接 Keepalive报文格式中只包含报文头,没有附加其他任何字段 BGP报文格式 - Route-refresh Route-refresh报文用来要求对等体重新发送指定地址族的路由信息 ,一般为本端修改了相关路由策略之后让对方重新发送Update报文,本端执行新的路由策略重新计算BGP路由。相关字段内容如下:AFI:Address Family Identifier,地址族标识,如IPv4 Res.:保留,8个bit必须置0 SAFI:Subsequent Address Family Identifier,子地址族标识 补充信息:在Open报文协商时会协商是否支持Route-refresh,如果对等体支持Route-refresh 能力,则可以通过refresh bgp命令手工对BGP连接进行软复位,BGP软复位可以在不中断BGP连接的情况下重新刷新BGP路由表,并应用新的策略 对于不支持Route-Refresh能力的BGP对等体,可以配置keep-all-routes 命令,保留该对等体的所有原始路由,这样不需要复位BGP连接即可完成路由表的刷新 缺省情况下未开启keep-all-routes BGP状态机
开始准备TCP的连接并监视远程对等体,启用BGP时,要准备足够的资源
正在进行TCP连接,等待完成中,认证都是在TCP建立期间完成的。如果TCP连接建立失败则进入Active状态,反复尝试连接
TCP连接已经建立成功,开始发送Open包,Open包携带参数协商对等体的建立
参数、能力特性协商成功,自己发送Keepalive包,等待对方的Keepalive包
已经收到对方的Keepalive包,双方能力特性经协商发现一致,开始使用Update通告路由信息
Idle状态是BGP初始状态。在Idle状态下,BGP拒绝对等体发送的连接请求。只有在收到本设备的Start事件后,BGP才开始尝试和其它BGP对等体进行TCP连接,并转至Connect状态
Start事件是由一个操作者配置一个BGP过程,或者重置一个已经存在的过程或者路由器软件重置BGP过程引起的 任何状态中收到Notification报文或TCP拆链通知等Error事件后,BGP都会转至Idle状态 在Connect状态下,BGP启动连接重传定时器(Connect Retry),等待TCP完成连接
如果TCP连接成功,那么BGP向对等体发送Open报文,并转至OpenSent状态 如果TCP连接失败,那么BGP转至Active状态 如果连接重传定时器超时,BGP仍没有收到BGP对等体的响应,那么BGP继续尝试和其它BGP对等体进行TCP连接,停留在Connect状态。 在Active状态下,BGP总是在试图建立TCP连接
如果TCP连接成功,那么BGP向对等体发送Open报文,关闭连接重传定时器,并转至OpenSent状态 如果TCP连接失败,那么BGP停留在Active状态 如果连接重传定时器超时,BGP仍没有收到BGP对等体的响应,那么BGP转至Connect状态 在OpenSent状态下,BGP等待对等体的Open报文,并对收到的Open报文中的AS号、版本号、认证码等进行检查
如果收到的Open报文正确,那么BGP发送Keepalive报文,并转至OpenConfirm状态 如果发现收到的Open报文有错误,那么BGP发送Notification报文给对等体,并转至Idle状态 在OpenConfirm状态下,BGP等待Keepalive或Notification报文。如果收到Keepalive报文,则转至Established状态,如果收到Notification报文,则转至Idle状态
在Established状态下,BGP可以和对等体交换Update、Keepalive、Route-refresh报文和Notification报文
如果收到正确的Update或Keepalive报文,那么BGP就认为对端处于正常运行状态,将保持BGP连接
如果收到错误的Update或Keepalive报文,那么BGP发送Notification报文通知对端,并转至Idle状态。
Route-refresh报文不会改变BGP状态 如果收到Notification报文,那么BGP转至Idle状态 如果收到TCP拆链通知,那么BGP断开连接,转至Idle状态 BGP状态机详情: BGP协议表项 BGP路由生成 不同于IGP路由协议,BGP自身并不会发现并计算产生路由,BGP将IGP路由表中的路由注入到BGP路由表中,并通过Update报文传递给BGP对等体
与IGP协议相同,BGP支持根据已有的路由条目进行聚合,生成聚合路由
Network注入路由 Network方式注入的路由必须是已经存在于IP路由表中的路由条目,否则不会被成功注入到BGP路由表中
通过Network方式注入路由:
AS200内的BGP路由器已经通过IGP协议OSPF学习到了两条路由:10.1.0.0/24和10.2.0.0/24,在BGP进程内通过network命令注入这两条路由,这两条路由将会出现在本地的BGP路由表中 AS200内的BGP路由器通过Update报文将路由传递给AS300内的BGP路由器 AS300内的BGP路由器收到路由后,将这两条路由加入到本地的BGP路由表中 import-route方式注入路由 Network方式注入路由只能逐条配置逐条注入IP路由表中的路由,如果注入的路由条目很多配置将会非常复杂
可以使用import-route方式,将直连路由、静态路由、OSPF路由、IS-IS路由等协议的路由注入到BGP路由表中
BGP聚合路由 BGP通告原则 BGP通过network、import-route、aggregate聚合方式生成BGP路由后,通过Update报文将BGP路由传递给对等体 BGP通告遵循以下原则:只发布最优路由 从EBGP对等体获取的路由,会发布给所有对等体 IBGP水平分割:从IBGP对等体获取的路由,不会发送给IBGP对等体 BGP同步规则指的是:当一台路由器从自己的IBGP对等体学习到一条BGP路由时(这类路由被称为IBGP路由),它将不能使用该条路由或把这条路由通告给自己的EBGP对等体,除非它又从IGP协议学习到这条路由,也就是要求IBGP路由与IGP路由同步。同步规则主要用于规避BGP路由黑洞问题。 BGP的基本配置 配置介绍 1. 启动BGP进程
[R1] bgp {as-number-plain | as-number-dot}
[R1-bgp] router-id ipv4-address
启动BGP,指定本地AS编号,并进入BGP视图。使用router-id命令配置BGP的Router ID,建议将BGP Router ID配置为设备Loopback接口的地址
2. 配置BGP对等体
[R1-bgp] peer {ipv4-address|ipv6-address} as-number {as-number-plain|as-number-dot}
创建BGP对等体,指定对等体地址以及AS号
3. 配置建立对等体使用的源地址、EBGP对等体最大跳数
[R1-bgp] peer ipv4-address connect-interface interface-type interface-number [ipv4-source-address]
[R1-bgp] peer ipv4-address ebgp-max-hop [ hop-count ]
指定发送BGP报文的源接口,并可指定发起连接时使用的源地址
指定建立EBGP连接允许的最大跳数。缺省情况下,EBGP连接允许的最大跳数为1,即只能在物理直连链路上建立EBGP连接
基本BGP配置实验: 配置接口:如上图所示配置接口地址和环回地址 R1与R2之间的两条链路分别配置物理接口的peer(EBGP): R1:
bgp 100
peer 12.12.12.2 as-number 200
peer 21.21.21.2 as-number 200
network 1.1.1.0 24
R2:
bgp 200
peer 12.12.12.1 as-number 100
peer 21.21.21.1 as-number 100
R2和R3之间建立回环peer(IBGP): 1 . R2和R3上建立32位回环口,启动OSPF,公告网络及回环地址,但不能公告与AS100和AS300直连的网络,目的保障IP通信;
R2:
ospf 1
area 0.0.0.0
network 2.2.2.0 0.0.0.255
network 23.23.23.0 0.0.0.255
R3:
ospf 1
area 0.0.0.0
network 3.3.3.0 0.0.0.255
network 23.23.23.0 0.0.0.255
2 . 保障R2与R3上回环口可ping通(打通IP网络);
R2:
bgp 200
peer 3.3.3.3 as-number 200
peer 3.3.3.3 connect-interface LoopBack 0
peer 3.3.3.3 next-hop-local
R3:
bgp 200
peer 2.2.2.2 as-number 200
peer 2.2.2.2 connect-interface LoopBack 0
peer 2.2.2.2 next-hop-local
配置R3、R4的EBGP: 1 . R4建立回环口,表示业务网络,
Interface loopback 0
Ip add 4.4.4.4 24
//并在BGP300中公告;
bgp 300
network 4.4.4.0 24
2 . 采用回环口的形式建立EBGP的peer
R4:
bgp 300
peer 3.3.3.3 as-number 200
peer 3.3.3.3 ebgp-max-hop 7 //解决EBGP的AS之间交换路由TTL=1的问题;
peer 3.3.3.3 connect-interface LoopBack 0
本实验,EBGP采用回环建立Peer。但一般情况下,EBGP邻居采用物理接口地址建立Peer。
系统视图设置静态路由:
ip route-static 3.3.3.3 255.255.255.255 34.34.34.3
//注意3.3.3.3为R3的回环口地址,掩码采用32位,目的是解决由EBGP300到200的路由公告中,若静态和BGP同时存在,BGP只选择静态路由,因静态优先级60,而BGP为255.使用32位掩码使得BGP的路由和静态路由成为两条不同路由同时存在。此时在R3或者R4上使用disp ip routing查看,其中关于4.4.4.0网络的IP路由表没有BGP的只有静态的
3 . 配置R3的回环EBGP
R3:
peer 4.4.4.4 as-number 300
peer 4.4.4.4 ebgp-max-hop 7
peer 4.4.4.4 connect-interface LoopBack 0
系统视图:
ip route-static 4.4.4.4 255.255.255.255 34.34.34.4
此时分别在AS100和AS300中查看路由表。Disp bgp routing-table
在R1进行 ping –a 1.1.1.1 4.4.4.4 操作,如果能够ping通则说明实验实现成功