BGP是一种自治系统间的动态路由发现协议,它的基本功能是在自治系统间自动交换无环路的路由信息。与OSPF和RIP等在自治区域内部运行的协议对应,BGP是一类EGP(Edge Gateway Protocol)协议,而OSPF和RIP等为IGP(Interior Gateway Protocol)协议。
BGP是在EGP应用的基础上发展起来的。EGP在此以前已经作为自治区域间的路由发现协议,广泛应用于NFSNET等主干网络上。但是,EGP被路由环路问题所困扰。BGP通过在路由信息中增加自治区域(AS)路径的属性,来构造自治区域的拓扑图,从而消除路由环路并实施用户配置的策略。同时,随着INTERNET的飞速发展,路由表的体积也迅速增加,自治区域间路由信息的交换量越来越大,都影响了网络的性能。BGP支持无类型的区域间路由CIDR(Classless Interdomain Routing),可以有效的减少日益增大的路由表。
BGP运行时刻分别与本自治区域外和区域内的BGP伙伴建立连接(使用Socket)。与区域内伙伴的连接称为IBGP(Internal BGP)连接,与自治区域外的BGP伙伴的连接称为EBGP(External BGP)连接。本地的BGP协议对IBGP和EBGP伙伴使用不同的机制处理。
1、BGP协议的层次位置
BGP使用Socket服务建立连接,端口号为179。
2、BGP的消息结构
BGP有4种类型的消息。分别为OPEN,UPDATE,KEEPALIVE和NOTIFY。它们有相同的消息头。
⑴消息头结构:
Marker : (16字节) 鉴权信息
Length : (2字节) 消息的长度
Type : (1字节) 消息的类型
0 :OPEN
1 :UPDATE
2 :NOTIFICATION
3 :KEEPALIVE
⑵OPEN消息结构:
消息头加如下结构 :
Version :(1字节) 发端BGP版本号
My Autonomous System :(2字节无符号整数) 本地AS号
Hold Time :(2字节无符号整数) 发端建议的保持时间
BGP Identifier :(4字节) 发端的路由器标识符
OptParmLen :(1字节) 可选的参数的长度
Optional Parameters :(变长) 可选的参数
⑶KEEPALIVE消息结构
KEEPALIVE消息只有一个消息头。
⑷NOTIFY消息结构
消息头加如下结构:
Errsubcode :(1字节) 辅助错误代码,略。
Data :(变长) 依靠于不同的错误代码和辅助错误代码。用于诊断错误原因。
⑸UPDATE消息结构
消息头加如下结构:
Unfeasible Routes Len :(2字节无符号整数) 不可达路由长度
Withdrawn Routes :(变长) 退出路由
Path Attribute Len :(2字节无符号整数) 路径属性长
Path Attributes :(变长) 路径属性(以下具体说明)
Network Layer Reachability Information :(变长) 网络可达信息(信宿)
其中退出路由和信宿地址的表示方法为一 的二元组。length一个字节,指示地址前缀的长度。prefix为地址前缀,长度1至4字节。
3、BGP路径的属性
每个路径属性由1字节的属性标志位,1字节的属性类型,1或2字节路由属性长度和路径属性数据组成。
属性标志位:
位0:0 表示此属性必选,1 表示此属性可选。
位1:0 表示此属性为非过渡属性,1表示此属性为过渡属性。
位2:0 表示所有属性均为路由起始处生成,1 表示中间AS加入了新属性。
位3:0 表示路由属性长度由1字节指示,1表示由2字节指示。
位4至位7:未用置0
位0和位1标识了BGP的4类路由属性:
-(01) 公认必选:BGP的UPDATE报文中必须存在的属性。它必须能被所有的BGP工具识别。公认必选属性的丢失意味着UPDATE报文的差错。这是为了保证所有的BGP工具统一于一套标准属性。
-(01) 公认自决:能被所有BGP识别的属性,但在UPDATE报文中可发可不发。
-(11) 可选过渡:假如BGP工具不能识别可选属性,它就去找过渡属性位。假如此属性是过渡的,BGP工具就接受此属性,并把它向前传递给其它BGP路由器。
-(10) 可选非过渡:当可选属性未被识别,且过渡属性也未被置位时,此属性被忽略,不传递给其它BGP路由器。
路由属性类型:
⑴ORIGIN (Type Code = 1,公认必选属性)
指示此路由起始类型:
⑵AS_PATH (Type Code = 2,公认必选属性)
AS路径属性由一系列AS路径段(Segment)组成。每个AS路径段为一三元组<路径段类型,路径段长度,路径值>。
路径类型有:
路径段长度用1字节表示AS号的数量,即最长为255个AS号。
路径值为若干AS号,每个AS号为2字节。
⑶NEXT_HOP (Type Code = 3,公认必选属性)
此属性为UPDATE消息中的信宿地址所使用的下一跳。
⑷MULTI_EXIT_DISC (Type Code = 4,公认自决属性)
简称MED属性。为一4字节无符合整数。它在AS区域间传播,用来帮助一个其它AS区域的BGP伙伴选择进入本AS区域的人口。
⑸LOCAL_PREF (Type Code = 5,公认自决属性)
本地优先级属性。为一4字节无符合整数。它在AS区域内传播,用来帮助一个本AS区域内BGP伙伴选择进入其它AS区域的出口。
⑹ATOMIC_AGGREGATE (Type Code = 6,公认自决属性)
元聚合属性。长度为零。它表示本地BGP在若干路由中选择了一个较抽象的(less specific)路由,而没有选择较具体(specific)的路由。
⑺AGGREGATOR (Type Code = 7,可选过渡属性)
聚合者属性。长度为6字节,分别为最后进行路由聚合的路由器的AS号(2字节)和IP地址(4字节)。
4、BGP协议的特点
BGP是一种AS(自治区域)外部路由协议,主要负责本自治区域和外部的自治区域间的路由可达信息的交换。因此,它所关心的拓扑结构是AS(自治区域)的拓扑结构,BGP通过UPDATE消息中路由的AS属性来构造AS的拓扑结构图,进一步通过此结构图来选择路由。
与OSPF,RIP等IGP协议相比,BGP的拓扑图要更抽象和粗略一些。因为IGP协议构造的是AS内部的路由器的拓扑结构图。IGP把路由器抽象成若干端点,把路由器之间的链路抽象成边,根据链路的状态等参数和一定的度量标准,每条边配以一定的权值,生成拓扑图。根据此拓扑图选择代价(两点间经过的边的权值和)最小的路由。这里有一个假设,即路由器(端点)转发数据包是没有的代价的。而在BGP中,拓扑图的端点是一个AS区域,边是AS之间的链路。此时,数据包经过一个端点(AS自治区域)时的代价就不能假设为0了,此代价要由IGP来负责计算。这体现了EGP和IGP是分层的关系。即IGP负责在AS内部选择花费最小的路由,EGP负责选择AS间花费最小的路由。
BGP作为EGP的一种,选择路由时考虑的是AS间的链路花费,AS区域内的花费(由BGP路由器配置)等因素。
如上所述,内部网关协议IGP需引入AS自治区域内部网络拓扑图其它各点的路由,同时向其它端点发送本端点(路由器)所知的路由,如直接路由、静态路由等。作为外部网关协议,BGP发送和引入路由的单位是整个AS自治区域,即BGP要发送本地路由器所在的AS内部的所有路由,引入其它AS自治区域的所有路由(假设不使用路由策略控制发送和引入)。其路由数量显然要远远大于IGP发送和引入的路由数量。因此,类似于IGP那样定时对外广播路由信息是不可取的。BGP采用发送路由增量(Incremental)的方法,完成全部路由信息的通告和维护:初始化时发送所有的路由给BGP对端(BGP Peer),同时在本地保存了已经发送给BGP对端的路由信息。当本地的BGP收到了一条新路由时(如通过IGP注入了新路由或加入了新的静态路由),与保存的已发送信息进行比较,如未发送过,则发送,如已发送过则与已经发送的路由进行比较,如新路由花费更小,则发送此新路由,同时更新已发送信息,反之则不发送。当本地BGP发现一条路由失效时(如对应端口失效),如此路由已发送过,则向BGP对端发送一个退出路由消息。
总之,BGP不是每次都广播所有的路由信息,而是在初始化全部路由信息后只发送路由的变化量(增量)。这样保证了BGP和对端的最小通信量,但同时增加了BGP的复杂程度。因为对于IGP,本地路由协议只需发送发送时刻所知的全部路由,而不保存任何已发送信息,路由选择的工作由对端来完成;而BGP必须为每个BGP对端保存已经发送的路由信息,以便发送一条新路由前确认其是否真的应该发送。
为了减小路由表的体积和发送路由的通信量,BGP还支持CIDR(Classless InterDomain Routing)。它使用带有较短的掩码(相对于自然掩码)的路由来在一条路由中表达更多的路由信息。如从202.112.1.0/24-202.112.254.0/24可以使用202.112.0.0/16表示,从而减小了路由表的体积和发送路由信息时的网络流量。
同时,作为AS自治区域间的路由协议,由于政治的、经济的等原因,BGP需要按照不同的路由的属性控制路由的发送和引入。因此,BGP有丰富的路由策略控制手断。
5、BGP协议中消息的应用
BGP使用TCP建立连接,本地监听端口为179。和TCP建立相同,BGP连接的建立也要经过一系列的对话和握手。TCP通过握手协商通告其端口等参数,BGP的握手协商的参数有:BGP版本,BGP连接保持时间,本地的路由器标识(Router ID),授权信息等。这些信息都在OPEN消息中体现。
BGP连接的具体过程参见BGP有限状态机。
BGP连接建立后,假如有路由需要发送则发送UPDATE消息通告对端路由信息。UPDATE消息主要用来通告路由信息,包括失效(退出)路由。UPDATE消息发布路由时,还要指定此路由的路由属性,用以帮助对端BGP协议选择最佳的路由。需要注重的是,由UPDATE消息的格式可以看出每个UPDATE消息只可以发布一种路由属性,本地BGP假如有路由属性完全相同的路由(只有信宿地址不同),则可以由一条UPDATE消息发布,否则只能使用不同的UPDATE消息发布。关于路由属性在BGP选择路由时的应用,参见BGP协议路由属性的应用部分。
在本地BGP路由变化时,也使用UPDATE消息修正对端BGP的路由表。
经过一段时间的路由信息交换后,本地BGP和对端BGP都无新路由通告,趋于稳定了。此时要定时发送KEEPALIVE消息以保持BGP连接的有效性。对于本地BGP,假如在超过保持时间的时间内,还未收到任何对端BGP消息,就认为此BGP连接已经无效,将此BGP连接断开。
当本地BGP在运行中发现错误时,要发送NOTIFY消息通告BGP对端。如对端BGP版本本地不支持,本地BGP收到了结构非法的UPDATE消息等。本地BGP退出BGP连接时也要发送NOTIFY消息。BGP收到NOTIFY消息后,要作相应处理。
6、BGP伙伴的有限状态机(FSM)
BGP有限状态机有6种状态:
1-Idle
2-Connect
3-Active
4-OpenSent
5-OpenConfirm
6-Established
BGP事件:
1-BGP Start
2-BGP Stop
3-BGP Transport connection open
4-BGP Transport connection closed
5-BGP Transport connection open failed
6-BGP Transport fatal error
7-ConnectRetry timer eXPired
8-Hold Timer expired
9-KeepAlive timer expired
10-Receive OPEN message
11-Receive KEEPALIVE message
12-Receive UPDATE message
13-Receive NOTIFICATION message
一个典型的过程为:Idle(启动消息)->Connect(TCP连接成功,发OPEN)->OpenSent(收到OPEN消息,协商成功)->OpenConfirm(收到KEEPALIVE消息)->Established(TCP连接关闭,有错误,或处理UPDATE消息失败,或收到NOTIFICATION消息)->Idle