资源预览内容
第1页 / 共15页
第2页 / 共15页
第3页 / 共15页
第4页 / 共15页
第5页 / 共15页
第6页 / 共15页
第7页 / 共15页
第8页 / 共15页
第9页 / 共15页
第10页 / 共15页
亲,该文档总共15页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
3故障定位基本思路和方法 关于本章 本章介绍处理常见故障的基本思路和方法。 3.1 故障定位的基本原 则 本节介绍故障定位的基本原则。 3.2 故障判断与定位的常用方 法 本节介绍故障判断与定位的常用方法。 3.1 故障定位的基本原 则 本节介绍故障定位的基本原则。 故障定位关键是:将故障点准确地定位到单站。 故障定位的一般原则可总结为:先外部,后内部;先网络,后网元;先高级,后低级; 先多波,后单波;先双向,后单向;先共性,后个别。 先定位外部,后定位内部 在进行系统的故障定位时,应该首先排除外部设备的问题。这些外部设备问题包括光 纤、光缆、客户设备和电源等问题。 先定位网络,后定位网元 传输设备出现故障时,有时不会只是一个单站出现告警信号,而是在很多单站同时会上 报告警。这时我们就需要通过分析和判断缩小导致故障的范围,快速、准确地定位出是 哪个站的问题。 先分析高级别告警,后分析低级别告警 在分析告警时,应首先分析高级别的告警,如紧急告警、主要告警;然后再分析低级别 的告警,如次要告警和提示告警。 先分析多波信号告警,后分析单波信号告警 在分析告警时,应先分析是多个波道都有问题还是仅单波道信号有问题。多波道信号同 时出现故障,问题通常在合波部分,处理了合波部分的故障后,单波道信号告警通常就 随之消除了。 先分析双向信号告警,后分析单向信号告警 在分析告警时,若“本站收、对端站发”的方向有告警,需要先检查“对端站收、本站发” 的方向是否有类似的故障现象,若双方向都有告警需要先分析处理。 先分析共性告警,后分析个别告警 在分析告警时,应先分析是个别问题还是共性问题,确定问题的影响范围。需要确定是 一个单板出问题,还是多个单板出现类似问题;对多光口单板,是一个光口有误码还是 多个或所有光口都有误码。 3.2 故障判断与定位的常用方 法 本节介绍故障判断与定位的常用方法。 对于一般性的硬件故障,一般采用“分析,环回,换板”的方法: ? 当故障发生时,首先通过对信号流向、告警事件和性能数据进行分析,初步判断故 障点范围。 3.2.1 信号流分析 法 本节介绍故障判断与定位中的信号流分析方法。 3.2.2 告警和性能数据分析 法 本节介绍故障判断与定位中的告警和性能数据分析法。 3.2.3 仪表测试 法 本节介绍故障判断与定位中的仪表测试法。 3.2.4 环回 法 本节介绍故障判断与定位中的环回法。 3.2.5 替换 法 本节介绍故障判断与定位中的替换法。 3.2.6 PRBS功能测试法本节介绍故障判断与定位中的 PRBS功能测试法。 3.2.7 配置数据分析 法 配置数据分析法是判断和定位故障的方法之一。 3.2.8 测试帧功 能 通过测试帧功能可定位和判断以太网业务故障。 3.2.9 RMON性能分析法 以太网业务中断或性能劣化后, 可以在 U2000中使用 RMON功能, 结合以太网 OAM、 环回、 Ping等操作,定位业务中断或性能劣化的位置。 3.2.1 信号流分析法 本节介绍故障判断与定位中的信号流分析方法。 先分析业务信号流向, 根据业务信号流向逐点排查故障是波分系统中故障定位的常用方 法。通过业务信号流的分析,可以较快地定位到故障点。 下面通过举例,对信号流分析法给予说明。 示例一:各站点均使用光波长转换类或支线路合一单板 ?故障现象: 组网结构如图 3-13-1所示。 A站到 B站其中一路客户业务中断, B站该路客户设备接 收无光或接收到大量误码。 图 3-1信号流分析法案例 1示意图 客户设备 OA DEMUX OTU 客户设备 A站 (OTM) B站 (OTM) ? 然后通过逐段测量光功率和分析光谱,排除光纤跳线或光缆故障,并昀终将故位到单板。 ? 昀后通过更换单板或更换光纤,排除故障问题。 U2000上提 供了业务信号流图的界面,具体查询方式请参见联机帮助中“浏览 WDM路径信号流图”。 ? 分析判断: B站客户设备接收无光或接收到大量误码,由图 3-13-1所示,B站客户设备接收的业务 信号流向为: A站客户设备? A站 OTU?A站 MUX?A站 OA?B站 OA?B站 DEMUX?B 站 OTU?B站客户设备,可能的故障原因包括: ? A站信号发送部分有问题。 ?光路问 题(包括光纤和光纤接头)。 ? B站信号接收部分有问题。 1. 先对 A站的 OTU单板告警和性能进行分析,如果 OTU单板客户侧接口有接 收无光告警或接收光功率过低时, 则故障点可能出在 A站客户设备的光发送端或客 户设备到 OTU单板的光纤跳线,或是 OTU单板的客户侧接收模块。 2. 如果 A站 OTU单板客户侧的输入光功率正常,再检测输出光功率是否正常, 如不正常则故障点在 OTU单板。 3. 如果 A站 OTU单板的输出光功率也没有问题,观察 A站 MUX板的输出光功 率是否有很大的变化。如果 A站上的波数比较多的话,丢失其中的一波不会使功率 发生大的变化,所以需要把 MUX板的 MON口信号接入 MCA板,查询是否发生掉波告 警。 4. 由于 MUX板主要工作器件是无源器件,损坏的可能性不大,因此如果 MCA 板检测到该波信号丢失,昀可能出故障的地方是连接 OTU单板和 MUX板的光纤跳 线。 5. OA板有输入、输出光功率检测功能。如果出现故障,受到影响的业务不会 仅仅是其中一波,所以故障出在 OA板的可能性很小。 6. 在站,按此信号流向进行分析: B站 OA?B站 DEMUX?B站 OTU单板? B 站客户设备。B站的信号流分析方法与 A站的分析方法类似。 示例二:各站点均使用支路板 +交叉板+线路板 ? 故障现象: 故障现象:组网结构如图 3-23-2所示。 A站到 B站其中一路客户业务中断, B站该路 客户设备接收无光或接收到大量误码。 图 3-2信号流分析法案例 2示意图 客户设备支路板线路板 MUX OA OA DEMUX线路板支路板客户设备 A站 (OTM) B站 (OTM) U200 0上提供了业务信 号流图的界面,具 体查询方式请参见 联机帮助 中“浏 览 WDM路径信号流 图”。 ? 分析判断:对于支线路分离的情况,参考图 3-23-2,B站客户设备接收的业务信号流 向为: A站客户设备?A站支路板A站交叉板?A站线路板?A站 MUX?A站 OA?B站 OA?B站 DEMUX?B站线路板B站交叉板B站支路板? B站客户设备,可能的故障 原因包括: ? A站信号发送部分有问题。 ?光路问 题(包括光纤和光纤接头)。 ? B站信号接收部分有问题。 1 A站支路板的告警和性能进行分析,如果支路板客户侧接口有接收无光告警 或接收光功率过低, 则故障点可能出在 A站客户设备的光发送端或客户设备到支路 板的光纤跳线,或是支路板的客户侧接收模块。 2 A站支路板客户侧的输入光功率正常,则检查交叉配置是否正确。若正确根 据交叉找到对应的线路板;对 B站的支路板、线路板的告警和性能进行分析,是否 有 BUS_ERR告警。若存在 BUS_ERR告警,故障可能出现在支路板、交叉板、线路板, 可根据更改配置法和替换法逐个排查。 3 BUS_ERR, 再检测线路板输出光功率是否正常, 如不正常则故障点在线路板。 4 OTU或支线路合一单板的分析方法类似。 3.2.2 告警和性能数据分析法 本节介绍故障判断与定位中的告警和性能数据分析法。 当系统发生故障时,一般会伴随有大量的告警事件和异常性能数据的产生,通过对这些 信息的分析,可大概判断出所发生故障的类型和位置。 获取告警和性能事件信息的方式有以下两种: ?通过网管查询传输系统当前或历史发生的告警和性能事件数据。 ?通过设备机柜和单板的指示灯的状态,了解设备当前的运行状况或存在告警的级 别。 指示灯的状态及含义, 参见 硬件描述 。通过网管获取故障信息,定位故障的特点是: ?全面:能够获取全网设备的故障信息。?准确:能够获取设备当前存在哪些告警、告警发生时间,以及设备的历史告警;能 够获取设备性能事件的具体数值。 ?如果告警和性能事件太多,可能会面临无从着手分析的困难。 ? 完全依赖于计算机、软件、通信三者的正常工作,一旦以上三者之一出问题,通过 该途径获取故障信息的能力将大大降低,甚至于完全失去。 注意 ?通过网管获取性能信息时,先要在网管上开启性能监视,否则性能信息不会上报。 ?通过网管获取告警或性能信息时, 应注意保证网络中各网元的当前网元运行时间设置正 确,倘若网元时间设置错误,将会导致告警、性能信息上报错误或根本不上报。 ?在维 护过程中,对某网元重下配置后,应特别注意将该网元的网元时间设为当前时间,否则 网元会工作在缺省时间里,而缺省时间并不是当前时间。 不同 OTU单板接入不同类别信号时,告警的产生、检测、传递有所不同。通过告警信号 流的分析,可以较快地定位到故障点。 示例一:非汇聚 OTU类单板处理 SDH标准信号信号流分析 以本站非汇聚类 OTU单板处理 SDH业务时,产生 R_LOS告警为例,介绍告警信号流分析 方法,如图 3-33-3所示。 图 3-3告警、性能数据分析法示例 1示意图 客户设备 OA DEMUX OTU 客户设备 A站 (OTM) B站 (OTM) 本节图中的 OTU单板的 ALS功能并未使用。 图 3-4非汇聚型 OTU处理 SDH信号的告警信号流 A站 B站 客户设备 波分侧 波分侧客户侧 XXX检测到告警并上报 告警处理 参考图 3-43-4,A站 OTU单板的客户侧接收 R_LOS信号, A站 OTU单板的波分侧对该告警 进行处理后, url=http:/www.nuaa001.com/魔兽私服/url传到 B站。 在 B站的 OTU 单板客户侧将检测到 REM_SF告警。该告警继续传送到 B站下游的客户端设备,并向客 户端设备上报 R_LOF告警。 若通过 U2000查询到 A站 OTU单板客户侧上报 R_LOS告警,B站客户设备上报 R_LOF告警。可判断为 A站 OTU单板的客户侧输入信号有问题。 示例二:非汇聚 OTU类单板处理 OTN标准信号信号流分析 以非汇聚类 OTU单板处理 OTN业务时, OTU单板对 OTU2_LOF告警的处理为例介绍告警 信号流分析方法,其他告警以此类推。如图 3-53-5所示,线路上传送的是 ODU2业务,A站 点到 B站点间光纤劣化。 图 3-5告警、性能数据分析法示例 2示意图 OTU OTU-西 客户设备 客户设备 OTM OTMOTM OTM B站 C站 A站 本节 图中的 OTU单板的 ALS功能并未使用。 图 3-6非汇聚型 OTU处理 OTN信号的告警信号流 SF: SF事件检测 告警处理 xxx检测到XXX告警并上报 参考图 3-63-6,A站到 B站的光纤劣化后,B站点 OTU-1单板波分侧检测到 OTU2_LOF (劣化比较严重的情况下,可能出现 LOF,可能出现 LOM,这里以 LOF为例),并进行 处理后传到 A站和 C站。在 C站的 OTU单板的波分侧将检测到 ODU2_PM_AIS;同时 C站 点将告警处理后经 B站点透传到 A站,A站点将上报 OTU2_BDI和 ODU2_PM_BDI。 若通过网管查询到 A站点 OTU单板波分侧有 OTU2_BDI和 ODU2_PM_BDI, B站 OTU单板波 分侧上报 OTU2_LOF告警,C站有 ODU2_PM_AIS,可判断 B站点波分侧输入信号异常,可 以进一步判断是否由 AB段的光纤劣化引起。 对于告警信号流的详细介绍,参见告警和性能事件参考。 A站 B站 C站 波分侧 波分侧波分侧 波分侧 OTUk_LOF/ 3.2.3 仪表测试法 本节介绍故障判断与定位中的仪表测试法。 概述 仪表测试法一般
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号