资源预览内容
第1页 / 共67页
第2页 / 共67页
第3页 / 共67页
第4页 / 共67页
第5页 / 共67页
第6页 / 共67页
第7页 / 共67页
第8页 / 共67页
第9页 / 共67页
第10页 / 共67页
亲,该文档总共67页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
Lecturer: Dai Zhibaol传输故障分析方法l传输分类故障的处理l掌握OptiX传输设备常用的故障分析方法l掌握OptiX传输设备典型故障业务中断、误码、ECC的处理方法o 内容o 目标传输故障分析方法u故障处理对维护人员的要求掌握SDH常用开销字节功能、告警信号流(告警-帧结构-逻辑功能块-单板硬件)熟练掌握所维护传输设备的基本操作熟悉所维护局的情况(组网拓扑、保护属性、业务分配、命令行配置)作好现场数据的采集与u故障定位的确关键:将故障点准确地定位到单站由于传输设备站与站之间的距离较远,在进行故障定位时,首先就应将故障点准确地定位到单站。u故障定位的原则在定位故障时,要尽可能准确地将故障定位到单站。在定位故障时,应先排除外部的可能因素,如光纤断,交换故障或电源问题等。l先外部,后传输l先单站,后单板从告警信号流中可以看出,线路板的故障常常会 引起支路板的异常告警,因此在故障定位时,应 按“先线路,后支路”的顺序,排除故障;l先线路,后支路l先高级,后低级在分析告警时,应首先分析告警级别高的告警, 如危急告警、主要告警;然后再分析低级别的告 警,如次要告警和一般告警。u故障定位的常用方法一分析 二环回 三换板一、当故障发生时,首先通过对告警事件、性能事件、 业务流向的分析,初步判断故障点范围; 二、通过逐段环回,排除外部故障,并最终将故障定位 到单站,乃至单板; 三、通过换板,排除故障问题。l通过网管获取告警和性能信息,进行故障定位全面性不仅是一个站、一块板的故障信息,而且是全网设备 的故障信息;详实性可以知道当前设备存在的告警是什么时间发生的,以 前曾经发生过什么历史告警。性能不好时,误码、指 针调整有多少。一、通过机柜顶部的告警指示灯查看告警 二、通过单板告警指示灯查看告警设备指示灯仅反映设备当前的运行状态,对于设备曾 经出过故障,无法表示;设备每种告警对应的指示灯闪烁情况,可以通过网管 软件进行重新定义,甚至于可以将某种告警屏蔽掉。缺点l通过设备上的指示灯获取告警信息,进行故障定位环回法,是SDH传输设备定位故障最常用,最行之有效的一种方法。1、软件环回是一种不彻底的环回,只能初步定位故障的位置。 2、对远端站点线路板第一个VC4作环回操作时,一定要确认环回后ECC通信不会中断,才可进行操作。一旦远端站点的ECC通信中断,则只能到远端站点现场才能解开环回,恢复ECC通信。3、“环回法”会导致正常业务的暂时中断,一般只有在出现业务中断等重大事故时,才使用环回法进行故障排除。u采用环回法应注意的问题:4.初步定位单板问题。u“环回法”的步骤:1.环回业务通道采样;2.画业务路径图;3.逐段环回,定位故障站点;一、环回业务通道采样: 1、从多个有故障的站点中选择其中的一个站点;2、从所选择一个站点的多个有问题的业务通道中选择其中的一个业务通道。由于自环第一个VC4通道,可能会影响ECC通信,因此尽量不要选择第一个VC4通道内的业务。画出所采样业务一个方向的路径图。 在路径图中表示出:该业务的源和宿,该业务所经过的站 点,该业务所占用的VC4通道和时隙。二、画业务路径图:例如 :依据中断业务的路径图,在1号站第2块支路板的第1个 2M通道外接一个2M误码仪,监测业务好坏。三、逐段环回,定位故障站点“替换法”就是使用一个工作正常的物件去替换一个怀疑工作不正常的物件,从而达到定位故障、排除故障的目的。这里的物件,可以是一段线缆、一个设备、一块单板、一块模块或一个芯片。“替换法”适用于排除传输外部设备的问题,如光纤、中继电缆、交换机、供电设备等;或故障定位到单站后,用于排除单站内单板或模块的问题。该方法适用于没有备板的情况下,初步定位故障类型,并暂时排除故障,恢复业务。“更改配置法”所更改的配置内容包括:时隙配置、板位配置等。查询、分析设备当前的配置数据,例如:分析以上的配置数据是否正常,来定位故障。时隙配置复用段的节点参数线路板和支路板通道的环回设置支路通道保护属性如:用误码仪测试业务通断、误码 用万用表测试供电电压,检查电压过高或过低问题“仪表测试法”指采用各种仪表(如误码仪、万用 表光功率计、SDH分析仪等)检查传输故障。“仪表测试法”分析定位故障,说服力比较强。但需要采用仪表。在一些特殊的情况下通过复位单板、单站 掉电重启、重新下发配置等手段可有效及 时的排除故障、恢复业务。但建议该处理故障的办法尽量少用,因为该方法不利于故障原因的彻底查清。遇到这种情况,除非情况紧急,一般还是应尽量使用上面介绍的方法,或请求支援尽可能地将故障定位出来,以消除设备内外隐患。1. 排除传输外部设备故障:=分离传输问题还是交换机问 题=光纤故障的排除=中继线缆故障的排除=供电电源故障的排除=接地问题的排除2.故障定位到单站=将故障定位到单站,最 常用的方法就是“环回法 ”。=另外,告警性能分析法 ,也是将故障定位到站 点比较常用的方法。3.故障定位到单板并最终 排除=故障定位到单站后, 进一步定位故障位置 最常用的方法就是替 换法。分类故障的处理单板失效或性能不好u常见原因l外部原因供电电源故障,如设备掉电、供电电压过低等交换机故障光纤、电缆故障。如光纤性能劣化、损耗过高,或光 纤损断;中继电缆脱落、损断或接触不良等l人为原因误操作设置了光路或支路通道的环回误操作更改、删除配置数据l设备本身故障l告警分析法l逐段环回法l互换、替换法u常用方法l检查各站登录是否正常,各站光路上是否 有危急告警。l检查业务中断站点支路板上业务通道。l逐段环回u处理步骤(对于网管维护人员)u无保护链型组网图5-1为四个站组成的一条无保护链,1站为网管中心站,集中型业 务,即每个站均与1站有2M业务。4站支路板有TU-AIS告警,1站支路板对应通道有LP-RDI告警, 1站和4站的2M业务中断。l组网配置l故障现象u处理步骤1.在1号站挂一2M误码表,监测1号站与4号站的2M业务。 2.通过网管对4号站的支路板作软件内环回。若仪表显示 业务正常,则说明是4号站有问题,进入第三步。若仪表显示业务中断,则说明传输设备有问题,进入第四步。 3.在4号站的DDF配线架上,再作一个对传输设备的硬件内环回,若此时仪表仍显示业务正常,则说明传输设备没有 问题。需排除交换机或中继电缆的问题。 4.分别对1号站西向线路板、2号站东向线路板、3号站东向线路板作内环回。5.若环回2号站东向线路板业务正常,环回3站西向线路板 业务不通,则可能3站有故障或2站的东向线路板有故障。 6.到达2号站,通过尾纤将东向线路板环回,若此时1站挂 表测试的业务正常,则说明2站东向线路板没有问题,故障点 在3站或光缆有问题,直接转第7步。若环回后业务不通,则说明该板有故障。通过更换该板, 排除此处故障,若此处故障排除后,业务恢复正常,则故障处 理完毕。否则继续作逐段环回。 7.到达3号站,对3号站作单站测试,通过尾纤将西向线路 板环回,发现业务不正常,更换3号站西向线路板,故障排除。u复用段环某日,维护人员发现,2站、3站相连的线路板出现RLOS告警,各站 交叉板均有保护倒换告警,查询各节点倒换状态正常。但3号站与1 号站的业务中断(N0.1个VC4),其它站业务正常。l组网配置某局Optix 622复用段保护环,组网图所示,1号站为网管中心站。l故障现象wMSP环OptiXeeee ewwww32451u复用段保护倒换后业务正常的必要条件:1、线路板正常监测到告警,正常传递K1、K2字节。2、主控板正确处理K1、K2字节,保护倒换协议正常。3、交叉板接受主控板发来指令,正常倒换。4、保护倒换的备用通道正常。1、中断业务样本采样:选取1号站第二支路板的第一个2M通道,即1站的t2:1。 2、保护倒换前,样本业务1号站的t2:1走的路径如图所示u处理步骤3、逐段环回,缩小故障范围:在1号站第二支路板的第一个2M通道上挂表测试然后通过网管逐段进行如下的环回操作。当站点数较多时,可采用二分法,进行环回操作。u处理步骤4、逐段环回,定位故障站点和单板:在对3号站的东向SL4板No.3VC4做外环回时,发现业务不通,而对4号站的西向SL4板No.3VC4做内环回时,业务正常,说明问题在3号站的东向SL4板和4号站的西向SL4板之间。u处理步骤5、更换3号站东向SL4板,故障仍存在。更换4号站西向SL4板,故障排除,说明该板不能正常穿通No.3VC4。u处理步骤光纤性能劣化、损耗过高光纤接头不清洁或连接器不正确设备接地不好设备附近有强烈干扰源设备散热不好、工作温度过高l设备原因线路板接收侧信号衰减过大、对端发送 电路有故障、本端接收电路故障时钟同步性能不好交叉板与线路板、支路板配合不好支路板故障风扇故障板失效或性能不好u常见原因l外部原因u常用方法:l告警性能分析法l逐段环回法l互换、替换法u处理步骤:l分析线路板误码性能事件,排除线路误码。l分析支路误码性能事件,排除支路误码。u典型故障(线路板故障导致的误码)四个站组成的一条无保护链,1站为网管中心站,集中型业务,即每个站均与1站有2M业务。u组网配置:u故障现象:l1站2M支路板有LPBBE误码l3站东向光板有RSBBE、MSBBE、HPBBE误码l4站西向光板有MSFEBBE、HPFEBBE误码l4站2M支路板有LPFEBBE误码u处理步骤:通过对上报的性能事件分析,可判断为3站东向光板收有问题或4站西向光板发有问题。到达3号站,通过尾纤自环3站的东向光板,3站东向光板误码和1站2M支路板误码消失,说明是4站西向光板问题。到达4站,更换西向光板,误码问题解决。四个站组成的一个复用段保护环,1站为网管中心站 ,每个站均与1站有2M业务。u组网配置:u典型故障(时钟板故障导致的误码问题)wMSP环eee ewww3241u故障现象1号站、3号站、4号站相应的2M业务通道报LPBBE 、LPFEBBE误码;2号站东向板、3号站东西向光板 、4号站西向光板报大量RSBBE、MSBBE、HPBBE 以及MSFEBBE、HPFEBBE误码,一些光板还存在大量指针调整。u处理步骤从误码性能事件分析,3号站的时钟单元故障。到达3号站,更换交叉板,误码消失,故障排除。SDH网元之间传递信息是通过ECC通信来实 现.ECC的物理层就是DCC通道,即SOH中的D1 D12字节。OptiX 系列产品使用其中的D1 D3字节,即再生段DCC,速率为192Kbit/s。注意:网管和网关网元之间通过TCP/IP协议传递信息若路由一切正常,走环网上的短路径若短路径不正常,则走环网上的长路径若长短路径皆不正常,则不能登录 :ecc-get-route; :ecc-get-sccinfo(bdinfo);ECC所走的路径为收发一致路由uECC路由规则:uECC故障常见原因l外部原因供电电源故障,如设备掉电、供电电压过低等光纤故障,如光纤性能劣化、损耗过高,或光 纤损断;l设备本身故障SCC板故障光板故障网元间有大量的性能数据传送u常用方法l告警性能数据分析法l替换法l经验处理法u处理步骤1.排除外部因素,如掉电、光纤折断、光纤性能劣化 等。将故障定位到单站或两个站之间。2.对于ECC问题,逐段自环不能定位故障;一般根据 从哪一站开始不能登录来判断故障位置。3.检查SCC板。4.检查光板。u故障案例:如图所示的链形组网中,1号站为网关网元,连接网管 。各网元间的光纤连接如图所示,“w”代表11板位光板 ,“e”代表12板位光板。u故障现象现在3号站、4号站登录不上。weweww网管1432u处理步骤:第一步:首先排除外部故障。1、如果3号站断电或低电压,则从网管就不能登录3号 站,而4号站的ECC数据由3号站转发,当然也不能登录 4号站。如果2号站到3号站之间的两根光纤断,网管也 无法登录3号站、4号站。采用告警
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号