资源预览内容
第1页 / 共94页
第2页 / 共94页
第3页 / 共94页
第4页 / 共94页
第5页 / 共94页
第6页 / 共94页
第7页 / 共94页
第8页 / 共94页
第9页 / 共94页
第10页 / 共94页
亲,该文档总共94页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
1BFD分析与故障定位软件三部许吉东烽火通信科技股份有限公司2013年2月 2培训内容: BFD协议诞生背景BFD检测原理BFD问题分析定位典型故障案例分析 3BFD协议诞生背景为了保护关键应用,网络中会设计有一定的冗余备份链路,网络发生故障时就要求网络设备能够快速检测出故障并将流量切换至备份链路以加快网络收敛速度。目前,一些硬件如SDH等可以提供这个功能,但是对于很多硬件或者软件无法提供这个功能,比如以太网。还有一些无法实现路径检测,比如转发引擎或者接口等,无法实现端到端的检测。目前的网络一般采用慢Hello机制,尤其在路由协议中,在没有硬件帮助下,检测时间会很长(例如:OSPF需要2秒的检测时间,ISIS需要1秒的检测时间)。这对某些应用来说时间过长。当数据速率到吉比特(Gbps),故障感应时间长代表着大量数据的丢失,并且对于不允许路由协议的节点没有办法检测链路的状态。 4同时,在现有的IP网络中并不具备秒以下的间歇性故障修复功能,而传统路由架构在对实时应用(如语音)进行准确故障检测方面能力有限。伴随着VoIP应用的激增,实现快速网络故障检测和修复越发显得必要。 5技术优点BFD协议提供了一个通用的标准化的介质无关和协议无关的快速故障检测机制。具有以下优点:1.对网络设备间任意类型的双向转发路径进行故障检测,包括直连物理链路、虚电路、隧道、MPLS LSP、多跳路由路径以及单向链路等。2.可以为不同的上层应用服务,提供一致的快速故障检测时间。3.提供毫秒级的检测时间,从而加快网络收敛速度,减少应用中断时间,提高网络的可靠性。 6培训内容: BFD协议诞生背景BFD检测原理BFD问题分析定位典型故障案例分析 7BFD检测原理 BFD(Bidirectional Forwarding Detection ): 双向转发检测; BFD实施在系统的业务层上,使检测更专注于业务报文转发的连通性; BFD可以运行在任何数据协议的顶层,对不同层次的网络提供检测; BFD能够在系统之间的任何类型通道上进行故障检测; 8BFD在两台网络设备上建立会话,用来检测网络设备间的双向转发路径,为上层应用服务。BFD本身并没有邻居发现机制,而是靠被服务的上层应用通知其邻居信息以建立会话。会话建立后会周期性地快速发送BFD报文,如果在检测时间内没有收到BFD报文则认为该双向转发路径发生了故障,通知被服务的上层应用进行相应的处理。 9BFD报文格式BFD 报文分为BFD控制报文和BFD Echo报文。一. BFD控制报文格式如下:必选可选012301234567890123456789012345678901VersDiagSta P F C ARDetectMultLengthMyDiscreaminatorYourDiscreaminatorDesiredMinTXIntervalRequiredMinRXIntervalRequiredMinEchoRXIntervalAuthTypeAuthLenAuthenticationDataD 10BFD控制报文各字段含义Vers:BFD协议版本号,目前版本号为1;Diag:诊断码,表明发送方最近一次会话Down的原因;Valuesare:0-NoDiagnostic1-ControlDetectionTimeExpired2-EchoFunctionFailed3-NeighborSignaledSessionDown4-ForwardingPlaneReset5-PathDown6-ConcatenatedPathDown7-AdministrativelyDown8-ReverseConcatenatedPathDown9-31-ReservedforfutureuseSta:发送方BFD会话当前状态,取值为:0代表AdminDown,1代表Down,2代表Init,3代表Up;P:Poll会话参数变化时置位;设置为1,表示发送系统请求进行连接确认,或者发送请求参数改变的确认;设置为0,表示发送系统不请求确认。 11F: Final如果收到的BFD控制报文P字段置位,则将下一个发送的BFD控制报文的F字段置位作为应答;设置为1,表示发送系统响应一个接收到P比特为1的BFD包;设置为0,表示发送系统不响应一个P比特为1的包。C:该字段置位表明BFD的实现是独立于控制平面的;A:该字段置位表明报文包含认证部分,会话需要进行认证;设置为1,表示控制报文包含认证字段,并且会话是被认证的D:Demand设置为1,表示发送系统希望操作在查询模式;设置为0,表示发送系统不希望操作在查询模式,或者表示发送系统不能操作在查询模式;R:保留位,发送时设为0,接收时忽略该字段;DetectMult:检测时间倍数;Length:BFD控制报文长度,单位为字节;MyDiscriminator:发送方产生的一个唯一非0值,用来标识不同的BFD会话;YourDiscriminator:如果已经收到会话邻居发送的BFD控制报文则该值为收到报文中的MyDiscriminator,否则为0; 12DesiredMinTXInterval:发送方支持的最小BFD控制报文发送时间间隔,单位为微秒;RequiredMinRXInterval:发送方支持的最小BFD控制报文接收时间间隔,单位为微秒;RequiredMinEchoRXInterval:发送方支持的最小BFDEcho报文接收时间间隔,单位为微秒。为0表示不支持BFDEcho报文;AuthType:认证类型;AuthLen:可选认证部分长度,包括AuthType和AuthLen字段,单位为字节;AuthenticationData:可选认证部分的数据内容。BFD控制报文采用UDP封装,目的端口号为3784,源端口号在49152到65535的范围内。 13二. BFD Echo报文BFDEcho报文提供了一种不依赖于BFD控制报文的故障检测方法。本端发送本端接收,远端不对报文进行处理,而只是将此报文在反向通道上返回。因此BFD协议并没有对BFDEcho报文的格式进行定义,唯一的要求是发送方能够通过报文内容区分会话。BFDEcho报文采用UDP封装,目的端口号为3785,目的IP地址为发送接口的地址,源IP地址由配置产生。 14Discriminator 字段 由于两个系统之间可能存在多个BFD会话,因此当收到BFD控制报文时,需要一个机制来将其分离到对应的会话上。 每个系统都必须选择唯一的标识符(Discriminator)确定每个会话(Session)。本地标识符封装在BFD控制报文的My Discriminator字段中,与远端系统BFD报文Your Discriminator对应。 一旦远端系统返回它的本地标识符,后续收到的BFD报文都将唯一地通过Your Discriminator字段分离到各个会话上。也就是说,源地址、接口等都可能发生变化,但BFD报文仍然能够对应到相应的会话上去。 15BFD检测原理BFD有两种操作模式:异步模式/查询模式 BFD的主要操作模式称为异步模式。在这种模式,系统之间相互周期性地发送BFD控制包,如果某个系统连续几个周期没有收到对端发送的报文,就认为会话为“Down”了。 16 BFD的第二种操作模式称为查询模式。查询模式下,会话两端通过3次握手建立起连接,一旦一个BFD会话建立并UP,系统停止发送BFD控制包,除非某个系统需要显式地验证连接性。在需要显式验证连接性的情况下,系统发送一个短系列的BFD控制包(由P和F比特控制“握手”的实现),然后,协议再次保持沉默。 17动态BFD BFDBFD使用本地标识符(使用本地标识符(Local DiscriminatorLocal Discriminator)和远端标)和远端标识符(识符(Remote DiscriminatorRemote Discriminator)区分同一对系统之间的多)区分同一对系统之间的多个个BFDBFD会话。会话。 VRVRR RP P支持静态配置支持静态配置BFDBFD会话和动态触发建立会话和动态触发建立BFDBFD会话。会话。 对于静态配置的对于静态配置的BFDBFD会话,其本地、远端标识符都通过手会话,其本地、远端标识符都通过手工配置。工配置。 对于动态触发建立的对于动态触发建立的BFDBFD会话包括:动态分配本端标识符会话包括:动态分配本端标识符和自学习远端标识符。和自学习远端标识符。 18自学习远端标识符1 A:MyDiscriminator100B:MyDiscriminator200YourDiscriminator0YourDiscriminator0Sip10.0.0.1Sip10.0.0.2Dip10.0.0.2Dip10.0.0.1A端收到B端发来的MyDiscriminator为200、YourDiscriminator为0的包。FPGA收到这种报文后,解析报文,将报文中的Vlan、Sip、Dip、MyDiscriminator存放于FIFO中。A端从FIFO中读取解析出来的信息,根据Dip查找A端已建立的bfd会话的Sip。若存在bfd会话的Sip与FIFO中读出的Dip相等,则FIFO中的MyDiscriminator即为A端该会话的YourDiscriminator。 19自学习远端标识符2A:MyDiscriminator100 B:MyDiscriminator200YourDiscriminator200YourDiscriminator0Sip10.0.0.1 Sip10.0.0.2Dip10.0.0.2Dip10.0.0.1此后,A端不再发出MyDiscriminator100,YourDiscriminator0的报文。在这之前若B尚未学习到YourDiscriminator。B将永远学不到YourDiscriminator。为解决该问题,增加了从FPGA寄存器中学习功能。B端收到A端发来的MyDiscriminator为100、YourDiscriminator为200的报文。FPGA收到这种报文后,解析报文中的MyDiscriminator、YourDiscriminator。根据解析出来的YourDiscriminator确定该报文所属系统中的bfd会话,并将解析出来的MyDiscriminator写入相应条目的FPGA中,供本端该条目学习YourDiscriminator。 20BFD检测原理BFD会话建立前有主动与被动两种模式。如果一台设备为主动模式,那么在会话建立前不管有没有收到对端发来的BFD控制报文,都会主动发送BFD控制报文。如果一台设备为被动模式,那么在会话建立前就不会主动发送BFD控制报文,直到收到对端发来的BFD控制报文才发送。我们现在做的是主动模式。下面对两端都为主动模式的会话建立过程进行说明。 21BFD检测原理三次握手-建立连接 22状态机迁移过程BFD使用三次握手的机制来建立会话,发送方在发送BFD控制报文时会在Sta字段填入本地当前的会话状态,接收方根据收到的BFD控制报文的Sta字段以及本地当前会话状态来进行状态机的迁移,建立会话。RouterA和RouterB的BFD收到上层应用的通知后,发送状态为DOWN的BFD控制报文。RouterB的BFD状态变化同RouterA。RouterB收到对端状态为DOWN的BFD控制报文后,本地会话状态由DOWN迁移到INIT,随后发送的BFD控制报文中将Sta字段填为2表明会话状态为INIT。RouterA的BFD状态变化同RouterB。 23RouterA收到对端状态为INIT的BFD控制报文后,本地会话状态由INIT迁移到UP,随后发送的BFD控制报文中将Sta字段填为3表明会话状态为UP。RouterB的BFD状态变化同RouterA。BFD双方状态都为UP,会话成功建立并开始检测链路状态。 24定时器协商BFD会话建立前BFD控制报文以1秒的时间间隔周期发送以减小报文流量。在会话建立后则以协商的时间间隔发送BFD控制报文以实现快速检测。在BFD会话建立的同时,BFD控制报文发送时间间隔以及检测时间也会通过报文交互协商确定。在BFD会话有效期间,这些定时器可以随时协商修改而不影响会话状态。BFD会话不同方向的定时器协商是分别独立进行的,双向定时器时间可以不同。BFD控制报文发送时间间隔为本端DesiredMinTXInterval与对端RequiredMinRXInterval之中的最大值,也就是说比较慢的一方决定了发送频率。检测时间为对端BFD控制报文中的DetectMult乘以经过协商的对端BFD控制报文发送时间间隔。 25 发送/接收报文能力的协商(Tx/Rx) - 实际报文发送周期 = max(本端min-tx-interval,对端min-rx-interval) - 实际报文接收周期 = max(对端min-tx-interval,本端min-rx-interval)检测周期的协商异步模式下: 检测周期 = =对端检测倍数DM(DM(检测倍数) * max () * max (对端min-tx-intervalmin-tx-interval,本端min-rx-interval)min-rx-interval)查询模式下:检测周期 = =本端检测倍数DM(DM(检测倍数) * max () * max (对端min-tx-intervalmin-tx-interval,本端min-rx-interval).min-rx-interval). 26如果加大本端DesiredMinTXInterval,那么本端实际发送BFD控制报文的时间间隔必须要等收到对端F字段置位的报文后才能改变,这是为了确保在本端加大BFD控制报文发送时间间隔前对端已经加大了检测时间,否则可能导致对端检测定时器错误超时。如果减小本端RequiredMinRXInterval,那么本端检测时间必须要等收到对端F字段置位的报文后才能改变,这是为了确保在本端减小检测时间前对端已经减小了BFD控制报文发送间隔时间,否则可能导致本端检测定时器错误超时。然而如果减小DesiredMinTXInterval,本端BFD控制报文发送时间间隔将会立即减小;加大RequiredMinRXInterval,本端检测时间将会立即加大。 27BFD故障检测BFD会话建立及定时器协商完成后,两端会以协商后的间隔发送BFD控制报文。每当收到BFD控制报文时,就会重置检测时间定时器,保持会话UP状态。如果在检测时间内没有收到BFD控制报文,BFD会话会迁移到DOWN状态,并通知该会话所服务的上层应用发生故障,由上层应用采取相应的措施。本端BFD会话DOWN后,发给对端的BFD控制报文中的Sta字段就填为1,通知对端会话DOWN,对端的BFD会话也迁移到DOWN状态。 28培训内容: BFD协议诞生背景BFD检测原理BFD问题分析定位典型故障案例分析 29 首先可以在网管上面点击主用交叉盘SCUR1(R860)/ SCUO1(R865),在状态里面查看BFD状态,就可以看到配置的BFD的状态,包括MYID 、yourid、BFD State、收发BFD包计数、BFD报文收发时间间隔(可知BFD的包速率)。BFD问题分析处理 30在协议盘里面查看BFD状态30 31在交叉盘里面查看BFD状态860的交叉盘SCUR1rootR860-2psauxroot8440.00.046961520pts/1S+14:370:00telnet10.26.0.9查看IP,如果被别人登陆,可以强制kill掉,rootR860-2kill844rootR860-1telnet10.26.0.9(交叉盘是9和10)Trying10.26.0.9.Connectedto10.26.0.9(10.26.0.9).Escapecharacteris.VxWorkslogin:bmu852Password:(输入aaaabbbb)865的交叉盘SCUO1rootR860-1telnet10.26.0.8(交叉盘是8和9)Trying10.26.0.8.Connectedto10.26.0.8(10.26.0.8).Escapecharacteris.VxWorkslogin:bmu852Password:(输入aaaabbbb) 32-wpstateWPSTATE=0,主用value=15=0xf需要确认登陆的是主用交叉盘。以A站和B站之间配置BFD为例。分别登陆两个配置BFD的源宿站点的交叉盘,通过输入showbfd分别查看两个站点配置的BFD状态,如果两个设备上看到的BFD状态都是DOWN,那么说明两边发送的BFD报文对端都未收到,如果A站是DOWN状态,B站是init状态,那么说明A站发出的BFD报文B站已经收到了,但是B站发送的报文A站未收到,所以只需要排查B站发到A站方向的BFD报文未收到原因。 33一. IP MPLSLSP BFD 应用场景:n用于IPRAN之间的LSP链路故障检测 344号站6号站主用LSPBFDID=10MYID=10;YOURID=10SLOT=12;PORT=1TX-LSPLABEL=310BFDID=10MYID=10;YOURID=10SLOT=3;PORT=1TX-LSPLABEL=310备用LSPBFDID=11MYID=11;YOUID=11SLOT=12;PORT=2TX-LSPLABEL=312BFDID=11MYID=11;YOUID=11SLOT=3;PORT=2TX-LSPLABEL=312 IP MPLSLSP BFD 配置举例 应用实例:应用实例:R860之间配置LSP1:1保护,如右图:LSP主用路径是4号站12/16号站3/1LSP备用路径是4号站12/25号站4/1,5号站4/26号站3/2R860之间配置IPMPLS-LSPBFD检测主备链路状态。业务和BFD规划如下表所示: 35BFD会话状态(会话状态(4号站)号站) 1.查看交叉盘已建立的bfd会话两条bfd会话,状态为down 362.查看已建立bfd会话详细配置信息 37查看主用LSP对应的bfdid为10的信息。输入print_bfd_infobfdno,后面参数是9(即bfdid值减1)n主要查看protocol=0,bfdtype=1,slot=12,port=1,lsplable=0x136,dmac、smac,;bfdtype:012bfdforiplsppw。n通过上面查看BFD配置,可知此条LSPBFD的MYID是10,yourid是10,bfdno为9出端口是12槽1号端口,dmac最后一位是0x11。LSP标签是0x136=310Dmac最后一位是0x11 38查看备用LSP对应的bfdid为11的信息。输入print_bfd_infobfdno,后面参数是10(即bfdid值减1)n主要查看protocol=0,bfdtype=1,slot=12,port=2,lsplable=0x138,dmac、smac,;bfdtype:012bfdforiplsppw。n通过上面查看BFD配置,可知此条LSPBFD的MYID是11,yourid是11,bfdno为10出端口是12槽2号端口,dmac最后一位是0x12。LSP标签是0x138=312dmac最后一位是0x12 393.打印各槽位端口对应sys idPrintSysId12槽位1号端口的SYSID是17,和前面看的DMAC最后一位0x11相等12槽位2号端口的SYSID是18,和前面看的DMAC最后一位0x12相等 404、查看fpga统计的bfd收发包计数n先敲DbgBao1、关闭lowGather中一直读取收发包计数开关nbfdbaobfdno,0打印已建立会话收发包计数,bfdno是bfdid-1,查看bfdid为10的条目包计数。打印说明FPGA已经发出BFD报文了 415、bfd 报文在交叉盘走向nR860:OAMFPGA(port53)交换芯片056524(port26)(port2)交换芯片156820槽位端口的sys口nR865:OAMFPGA(port1)交换芯片056843(port5)(port5)交换芯片156845槽位端口的sys口 426、交换芯片0上收发包计数bao(需要看两遍)从上面看的包统计可知BFD包从FPGA发到53口26口有发包 437、交换芯片1上收发包计数nbao1(需要看两遍)芯片1的2口有收包15口有收包 44 8、打印下框槽位sys口对应交换芯片1逻辑 端口 号12槽位1号端口对应15,从上面看的bao1统计,15口有发包,所以交叉盘已经把BFD包发到业务盘了,需要在业务盘查看。 45 9.在业务盘上面查看BFD包12槽位1号端口看bao统计看40和16口,40口有收包,16口有发包可说明BFD包已经发到对端设备去了。可以通过端口镜像来查看BFD包是否已经发出了业务盘端口,并且看BFD报文是否正确。 46 10.通过镜像抓取BFD报文 。通过镜像命令抓面板口发出去的BFD报文:ApiSetMirrorPort0,16,64,4;DbgSetRxPrint0,1ACE00B0E0100AC01040C01008847001361FF4510003400004000FF11F494040404047F00000CC0030EC800200000204003180000000A0000000A000f4240000f424000000000 4711. BFD报文解析 。 48Sta=01(DOWN),02(init),03(UP),对应包的内容是2040、2080、20C0。对端设备发过来的BFD包也可以通过收发包计数和端口镜像功能确认BFD包是否发到了FPGA,或是包在哪个端口丢了。 4912.BFD丢包分析(1)6号站的3/1,LSP-RX标签为310=0x136,在网管上面打开6号网元,打开3号盘的状态,查看入TUNNEL表状态信息,找到标签为310的收发包计数,看是否有值,第一次看了后还需要再看一遍,看包数值是否在增加。网管上面查看丢包原因方法:选中要看的NP单盘,点右键打开状态监视 50点击端口丢包原因查询右边的按钮,查看各个端口的丢包原因。看丢包原因: 51(2)查看NP单盘配置 如果在6号站的3号NP盘上面有“REASON_ING_NNI_MPLS_ACTION_INVALID_OUTERLAB”第一层标签动作非法的丢包原因,那么需要查看LSP-RX配置内容是否存在并看配置是否正确。-apiHelprDbgGetAllCfgInfo(unit)-printAllconfiginfoDbgGetLspInstInfo(unit)-printlsp-instinfoDbgGetEncapTunnelInfo(unit)-printencap-tunnelinfoDbgGetIntfInfo(unit,intfId)-printintfinfoDbgGetL3RxPwInfo(unit,vpnId)-printL3RxPwInfoDbgGetL3TxPwInfo(unit,vpnId)-printL3TxPwInfoDbgGetIngressAclInfo(unit,aclId,aclType)-printing-aclinfoDbgGetEgressAclInfo(unit,aclId)-printegr-aclinfo 52LSP-RX标签为310=0x136,查找看的配置里面是否有mTunLabel=0x136的配置。-DbgGetLspInstInfo=LSP-INSTinitFlag=1,usedTotal=4,error=0=mIngDevId=0x2131101,mEgrDevId=0xb1a1001,mLspId=0x1,mTunLabel=0x136.:flags=0x1(intPriR=BEN,DropRedN,intPri=(0,G)N,expMap=0Y,intPriG=0N.:PNodeVpOamActionTRANS),LspOamLmId=0,LspTpidEnable=N.:LspMsPwEgrTunnelEnable=N,tunnelId=0,tunnelId_P=0.:Action=IPOP,vrfId=0,sysPort=0,outPort=0,vid=0x0,ip=127.0.0.1.:push:label=0x0,flags=0x14,exp=0N,expMapId=0Y,ttl=0x0S.:swap:label=0x10,flags=0x14,exp=0N,expMapId=0Y,ttl=0xffD.:configFlag=0,posId=34,MplsLspPosId=34,hitCnt=0value=0=0x0-0x82value=130=0x82看NP盘LSPRX配置: 53LSP-RX标签为310=0x136,查看此标签的收包计数。-DbgGetMplsLspInfoByLabel0,310num=1:mRule=TUNNEL,action=IPOP,vrfId=0.:mTunLabel=0x136.:ingFlags=0x9(intPriR=BEN,DropRedN),intPri=(0,G)N,expMap=0Y,intPriG=0N.:PNodeVpOamActionTRANS,LspOamLmId=0,LspTpidEnable=N.:LspMsPwEgrTunnelEnable=N,tunnelId=0,tunnelId_P=0.:rvMplsIdx=0x310001a7,rvIifIdx=0x0,rvMeterIdx=0x0.:port=0,vid=0,ip=127.0.0.1,tunNum=0,pass=1.:swap:label=0x10,flags=0x14,exp=0N,expMapId=0Y,ttl=0xffD.:rvEgrNextHopIdx=0x0,rvEgrTunnelIdx=0x0.:bank=30,posId=34,hitCnt=0,rvtCounter=0x33000023/0x0.:Rx:Packet=6,byteH,L=0,657122value=0=0x0-这个命令输入两遍查看,看收包是否有变化。看NP盘LSPRX包计数: 54如果NP盘上面有“REASON_ARP_INVALID”ARP表项不存在的丢包原因,那么需要查看ARP配置内容是否存在并看配置是否正确。先看面板口1口对应的端口-PrintPortMapLINE1:16LINE2:52LINE3:48LINE4:60SYS1:20SYS2:40SYS3:44SYS4:8OAM1:27OAM2:28OAM3:31OAM4:29OAM5:30看NP盘端口对应关系: 55-DbgGetArpInfoByPort0,0,16-portType=0,portTgid=16,ArpMessageCnt=1-Arp=16,0:flags=0x0.:dip=0x0a010101,subPortVlan=0.:mac=0xac-e0-87-03-03-08.:configFlag=0,rvArpIndex=0x06000000value=0=0x0看NP盘ARP配置: 56二. IP MPLS-IP BFD(一)静态BFD应用场景:n应用于trackBFD,可以加快VRRP检测速度;静态路由BFD,可以加快主用路径断了切换到备用路径。 574号站6号站静态路由BFDBFDID=11MYID=11;YOURID=11SLOT=12;PORT=1端口IP= 46.0.0.4 BFDID=11MYID=11;YOURID=11SLOT=3;PORT=1端口IP= 46.0.0.46 IP MPLSIP BFD 配置举例 应用实例:应用实例:R860之间配置静态路由BFD,如右图:路径是4号站12/16号站3/1R860之间配置静态路由IPBFD检测路径状态。BFD规划如下表所示: 58BFD会话状态(会话状态(4号站)号站) 1.查看交叉盘已建立的bfd会话一条bfd会话,状态为down 592查看BFD配置是否正确输入print_bfd_info,后面参数是bfdno(即bfdid值减1)59主要查看protocol 、bfdtype、slot、port,dmac、smac,protocol 是0表示是IP MPLS ,protocol 是1表示是MPLS-TP模式 ;bfdtype:012 bfd for iplsppw。通过上面查看BFD配置,可知此条IP BFD的sip是 46.0.0.4,Dip是 46.0.0.6,MYID和yourid都是11,bfdno为10出端口是12槽1号端口,dmac最后一位是0x11。 603在交叉盘和NP盘上面查看收发包计数和前面的LSPBFD相同。通过镜像命令抓面板口发出去BFD报文:ApiSetMirrorPort0,16,64,4的60AC E0 0B 0E 01 00 AC 01 04 0C 01 00 81 00 E0 0B 08 00 45 10 00 34 00 00 40 00 FF 11 1F 9F 2E 00 00 04 2E 00 00 06 C0 04 0E C8 00 20 00 00 20 40 03 18 00 00 00 0B 00 00 00 0B 00 0F 42 40 00 0F 42 40 00 00 00 00通过镜像抓取BFD报文 。 61抓到以上报文,分析报文内容:61 62二. IP MPLS-IP BFD(二)动态BFD应用场景:nOSPF、IS-IS、BGP等类型BFD,可以加快路由协议收敛。 634号站6号站静态路由BFDBFDID=1801MYID=1801;YOURID=0SLOT=12;PORT=1sip= 16.0.0.1 ,dip= 16.0.0.2 BFDID=1801MYID=1801;YOURID=0SLOT=3;PORT=1SIP= 16.0.0.2,DIP= 16.0.0.1 IP MPLSIP BFD 配置举例 应用实例:应用实例:R860之间配置OSPF动态BFD,如右图:路径是4号站12/16号站3/1R860之间配置动态IPBFD检测。BFD规划如下表所示(bfdid是协议盘从1801开始自动分配的): 64BFD会话状态(会话状态(4号站)号站) 1.查看交叉盘已建立的bfd会话一条bfd会话,状态为down 652查看BFD配置是否正确输入print_bfd_info,后面参数是bfdno(即bfdid值减1)主要查看protocol、bfdtype、slot、port,dmac、smac,;bfdtype:012bfdforiplsppw。通过上面查看BFD配置,可知此条IPBFD的sip是16.0.0.1,Dip是16.0.0.2,MYID是1801,Learn_en自学习使能,bfdno为1800出端口是12槽1号端口,dmac最后一位是0x11。 663在交叉盘和NP盘上面查看收发包计数和前面的LSPBFD相同。通过镜像命令抓面板口发出去的BFD报文:ApiSetMirrorPort0,16,64,4AC E0 0B 0E 01 00 AC 01 04 0C 01 00 08 00 45 10 00 34 00 00 40 00 FF 11 5B A6 10 00 00 01 10 00 00 02 C0 02 0E C8 00 20 00 00 20 40 03 18 00 00 07 09 00 00 00 00 00 0f 42 40 00 0f 42 40 00 00 00 00通过镜像抓取BFD报文 。 6767抓到以上报文,分析报文内容: 68三. IP MPLSPW BFD 应用场景:n用于IPRAN之间的PW故障检测 694号站5号站6号站主用PWBFDID=12MYID=12;YOURID=12SLOT=12;PORT=1TX-LSPLABEL=310PWLABEL=20无BFDID=12MYID=12;YOURID=12SLOT=3;PORT=1TX-LSPLABEL=310PWLABEL=20备用PWBFDID=13MYID=13;YOUID=13SLOT=12;PORT=2TX-LSPLABEL=312PWLABEL=22BFDID=13MYID=13;YOUID=13SLOT=4;PORT=1TX-LSPLABEL=312PWLABEL=22无 IP MPLSPW BFD 配置举例 应用实例:应用实例:R860之间配置PW冗余保护,如右图:PW主用路径是4号站12/16号站3/1PW备用路径是4号站12/25号站4/1R860之间配置IPMPLS-PWBFD检测主备PW状态。业务和BFD规划如下表所示: 701.查看交叉盘已建立的bfd会话 BFD会话状态(4号站) 70两条bfd会话,状态为down 712查看主用PW BFD配置输入print_bfd_info,后面参数是11(即bfdid值减1)主要查看protocol=0,bfdtype=2,slot=12,port=1,lsplable=0x136,pwlabel=0x14,pwbfdtype=0,dmac、smac;bfdtype:012bfdforiplsppw。通过上面查看BFD配置,可知此条PWBFD的MYID是12,yourid是12,bfdno为11出端口是12槽1号端口,dmac最后一位是0x11。BFD标签信息(标签信息(4号站)号站) 72查看备用PW BFD配置输入print_bfd_info,后面参数是12(即bfdid值减1)主要查看protocol=0,bfdtype=2,slot=12,port=2,lsplable=0x138,pwlabel=0x16,pwbfdtype=0,dmac、smac;bfdtype:012bfdforiplsppw。通过上面查看BFD配置,可知此条PWBFD的MYID是13,yourid是13,bfdno为12出端口是12槽2号端口,dmac最后一位是0x12。 733在交叉盘和NP盘上面查看收发包计数和前面的LSPBFD相同。通过镜像命令抓面板口发出去的BFD报文:ApiSetMirrorPort0,16,64,473AC E0 0B 0E 01 00 AC 01 04 0C 01 00 88 47 00 13 60 FF 00 01 41 FF 10 00 00 07 20 40 03 18 00 00 00 0C 00 00 00 0C 00 0F 42 40 00 0F 42 40 00 00 00 00 00 00 00 00 00 00 00 00 00 00通过镜像抓取BFD报文 。 7474抓到以上报文,分析报文内容: 75四. MPLS-TP-LSP BFD应用场景:n用于IPRAN和PTN之间的LSP链路故障检测 764号站6号站主用LSPBFDID=10MYID=10;YOURID=10SLOT=12;PORT=1LSPLABEL=310BFDID=10MYID=10;YOURID=10SLOT=16;PORT=1LSPLABEL=310备用LSPBFDID=11MYID=11;YOUID=11SLOT=12;PORT=2LSPLABEL=312BFDID=11MYID=11;YOUID=11SLOT=16;PORT=2LSPLABEL=312 MPLS-TP-LSP BFD配置举例 应用实例:应用实例:R860和640之间配置LSP1:1保护,如右图:LSP主用路径是4号站12/16号站(640)16/1LSP备用路径是4号站12/25号站(640)4/1,5号站4/26号站(640)16/2R860he640之间配置MPLS-TP-LSPBFD检测主备链路状态。业务和BFD规划如下表所示: 77BFD会话状态(会话状态(4号站)号站) 1.查看交叉盘已建立的bfd会话两条bfd会话,状态为down 782.查看已建立bfd会话详细配置信息 79查看主用LSP对应的bfdid为10的信息。输入print_bfd_infobfdno,后面参数是9(即bfdid值减1)n主要查看protocol=1,bfdtype=1,slot=12,port=1,lsplable=0x136,pwlabel=0xd,dmac、smac;bfdtype:012bfdforiplsppw。n通过上面查看BFD配置,可知此条LSPBFD的MYID是10,yourid是10,bfdno为9出端口是12槽1号端口,dmac最后一位是0x11。 80查看备用LSP对应的bfdid为11的信息。输入print_bfd_infobfdno,后面参数是10(即bfdid值减1)n主要查看protocol=1,bfdtype=1,slot=12,port=2,lsplable=0x138,pwlabel=0xd,dmac、smac;bfdtype:012bfdforiplsppw。n通过上面查看BFD配置,可知此条LSPBFD的MYID是11,yourid是11,bfdno为10出端口是12槽2号端口,dmac最后一位是0x12。 813在交叉盘和NP盘上面查看收发包计数和前面的LSPBFD相同。通过镜像命令抓面板口发出去的BFD报文:ApiSetMirrorPort0,16,64,481AC E0 0B 0E 01 00 AC 01 04 0C 01 00 88 47 00 13 60 FF 00 00 D1 FF 10 00 00 22 20 40 03 18 00 00 00 0A 00 00 00 0A 00 0F 42 40 00 0F 42 40 00 00 00 00 00 00 00 00 00 00 00 00 00 00通过镜像抓取BFD报文 。 8282抓到以上报文,分析报文内容: 83五. MPLS-TP PW BFD 应用场景:n用于IPRAN和PTN之间的PW故障检测 844号站5号站6号站主用PWBFDID=12MYID=12;YOUID=12SLOT=12;PORT=1LSPLABEL=310PWLABEL=20无BFDID=12MYID=12;YOUID=12SLOT=16;PORT=1LSPLABEL=310PWLABEL=20备用PWBFDID=13MYID=13;YOUID=13SLOT=12;PORT=2LSPLABEL=312PWLABEL=22BFDID=13MYID=13;YOUID=13SLOT=16;PORT=2LSPLABEL=312PWLABEL=22无MPLS-TP PW BFD 配置举例 应用实例:应用实例:R860与640配置PW冗余保护,如右图:PW主用路径是4号站12/16号站(640)16/1PW备用路径是4号站12/25号站(640)16/2R860与640之间配置MPLS-TPPWBFD检测主备PW状态。业务和BFD规划如下表所示: 85 BFD会话状态(4号站) 1.查看交叉盘已建立的bfd会话85两条bfd会话,状态为down 862查看主用PW BFD配置输入print_bfd_info,后面参数是11(即bfdid值减1)主要查看protocol=1,bfdtype=2,slot=12,port=1,lsplable=0x136,pwlabel=0x14,pwbfdtype=0,dmac、smac;bfdtype:012bfdforiplsppw。通过上面查看BFD配置,可知此条PWBFD的MYID是12,yourid是12,bfdno为11出端口是12槽1号端口,dmac最后一位是0x11。BFD标签信息(4号站) 87查看备用PW BFD配置输入print_bfd_info,后面参数是12(即bfdid值减1)主要查看protocol=1,bfdtype=2,slot=12,port=2,lsplable=0x138,pwlabel=0x16,pwbfdtype=0,dmac、smac;bfdtype:012bfdforiplsppw。通过上面查看BFD配置,可知此条PWBFD的MYID是13,yourid是13,bfdno为12出端口是12槽2号端口,dmac最后一位是0x12。 883在交叉盘和NP盘上面查看收发包计数和前面的LSPBFD相同。通过镜像命令抓面板口发出去的BFD报文:ApiSetMirrorPort0,16,64,4AC E0 0B 0E 01 00 AC 01 04 0C 01 00 88 47 00 13 60 FF 00 01 41 FF 10 00 00 22 20 40 03 18 00 00 00 0C 00 00 00 0C 00 0F 42 40 00 0F 42 40 00 00 00 00 00 00 00 00 00 00 00 00 00 00通过镜像抓取BFD报文 。 89抓到以上报文,分析报文内容: 90培训内容: BFD协议诞生背景BFD检测原理BFD问题分析定位典型故障案例分析 91(一)查BFD问题注意以下问题:1.先登录源宿两个配置BFD站点的交叉盘,看有无BFD配置(showbfd)。2.SYS口有收包,面板口没有发BFD包,先看下单盘对应的端口和SYS口状态,看是否是UP。3.面板口有收包,SYS口没有发BFD包,先看下单盘对应的端口和SYS口状态,看是否是UP。4.PWBFD不能UP,看CW控制字是否配置,客户端槽位和端口的状态是否是UP。5.BFDforIP的动态BFD看两个站点的SIP和DIP是否对应。 92(二)BFD案例分析1.排查测试BFDforIP动态不通的问题,最后查到是在过站的两个端口配置了水平分割,导致BFD报文在面板口丢了,不应该在那两个端口配置水平分割,删除此配置后BFD就UP了。2.排查模拟测试武汉电信BFDforOSPF通后又DOWN的问题,查到的原因是BFD建立UP后,仪表不是3.3ms发一个包,而是10ms才发一个包,BFD检测就会超时,这样就会导致BFDDOWN掉。修改仪表设置后问题解决。3.排查和华为互通动态bfdforlsp的BFD不能UP的问题,最后查到是面板口有收包,但是SYS口没有发包,原因是没有在协议盘配置220G模式,配置后BFD就UP了。 934.排查BFDforLAG不通的问题,查的原因是两个站的DIP和SIP配置不是对应的,由于IP不正确导致无法学习对端会话ID,修改为正确的IP后问题解决。5.排查广州联通测试LSP保护BFD不通的问题,排查的原因是NP盘的SYS3口对应的44口没有Link。SYS3口Link后,BFDUP了。6.排查车间测试LSP1:1保护备用BFD不通的问题,查的原因是BFD报文丢弃了,丢包原因是REASON_ARP_INVALID,最后查到是LSP配置的下一跳IP地址配错了,修改正确后问题解决。 94感谢聆听!
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号