资源预览内容
第1页 / 共48页
第2页 / 共48页
第3页 / 共48页
第4页 / 共48页
第5页 / 共48页
第6页 / 共48页
第7页 / 共48页
第8页 / 共48页
第9页 / 共48页
第10页 / 共48页
亲,该文档总共48页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
爱立信常见故障处理 (核心网室)故障处理技术指引故 障 现 象用指今DPWSP查看CP状态如下: CP40: 故障处理技术指引 故 障 现现 象在交换机上执行指令ALLIP时出现告警标题为CP FAULT。 故障处理技术指引故 障 现 象在交换机上执行指令ALLIP时出现告警标题为RP FAULT或EM FAULT。 故障处理技术指引 故 障 现现 象在交换机上执行指令ALLIP时出现告警标题为BACKUP INFORMATION FAULT。(若是HLR上出现此告警, 则派任务工单给监控在夜间做CP备份) 故障处理技术指引故 障 现 象在交换机上执行指令ALLIP时出现告警标题为GROUP SWITCH FAULT。 ALLIP; 810硬件: DISTRIBUTED GROUP SWITCH FAULT UNIT TCASE STATE FTYPE XM-B-0-1 1 BLOC INTERNAL501进进入“AP LOCAL MODE”下用指令 “AFPFTI F TRANSFERQUEUE”,告警便可以 消除。 故障处处理技术术指引故 障 现现 象告警AP SYSTEM ANALYSIS 详细详细 描述:A2/APZ “GZMMSC63/JB/0/0“ 804 041127 0011 AP SYSTEM ANALYSIS AP APNAME NODE NODENAME1 GZG13MAP1C A GZG13MAP1A OBJECT COUNTER INSTANCE LIMIT VALUE LogicalDisk % Free Space C: 故障处处理技术术指引处处 理 流 程C盘盘空间间不足时时可删删除的文件 1、C:acsdataFtpmktrbuild该该目录录存储储的是爱爱立信TR需要的logfile,可以完全删删 除(一般可在提交给爱给爱 立信后即刻删删除)。 2、C:Temp该该目录录存储储的是windows NT系统统的临时临时 文件,可以完 全删删除。 3、C:WINNTsystem32logfilesMSFTPSVC1C:WINNTsystem32logfilesMSFTPSVC2C:WINNTsystem32logfilesMSFTPSVC3该该目录录存储储的是windows NT系统记录统记录 的用户户登录录信息 、安全事件信息等 logfiles,可删删除较较旧的文件,建议议至少保留一周之内的文件 ,如实实在空间间不足,也可全部删删除。故障处处理技术术指引处处 理 流 程4、C:acslogsfch该该目录录下如果有扩扩展名为为.old的文件,形似: acs_fch_activity.old,为为系统统自动动保留的旧版本文件,可删删除 该该.old文件。C:acslogsprc该该目录录下如果有扩扩展名为为.old的文件,形似: ACS_PRC_error.old,为为系统统自动动保留的旧版本文件,可删删除 该该.old文件。C:acslogsusa该该目录录下如果有扩扩展名为为.old的文件,形似:usa.tmp.old,为为 系统统自动动保留的旧版本文件,可删删除该该.old文件。C:acslogscore该该目录录下如果有扩扩展名为为.unknown.x(其中x为为一阿拉伯数字) 的文件,形似:core.unknown.x,可删删除该该文件。 5、清空C盘盘回收站故障处处理技术术指引故 障 现现 象详细详细 描述:Alarm Identifier Class Category Time 8796:0 A2 APZ Sun Nov 21 07:17:42 2004 Object of Reference LOGFILE/APPLICATION-VIRUS Alarm Text AP ANTIVIRUS FUNCTION FAULT SIGNATURE FILE DOWNLOAD FAILED Problem DataSun Nov 21 07:17:41 2004 3004 GZG33MAP2A 2 264 InoculateIT EVENTLOG_WARNING_TYPE 07:16:11 11/21/04 176 gzg33map2a 07:17:41 11/21/04 The automatic download has run 4 times unsuccessfully. The next attempt will occur at the regularly scheduled download time. 故障处处理技术术指引处处 理 流 程解决方法:在AP1设设置eTrust软软件,记记住沟选选 Redistribution Server选项选项 , 然后APG2(计费专计费专 用)就可以通过过 “Redistribution Server”的方式从APG1 更新病毒库库。故障处处理技术术指引故障现现象在交换换机上执执行指令ALLIP时时出现现告警标题为标题为 AP SYSTEM CLOCK NOT SYNCHRONIZED,一般由于AP 和CP时时 间间不同步(差值值大于10分钟钟)引起 处处理流程处处理流程如下: 1. 检查检查 CP 时间时间 故障处理技术 指引故 障 现现 象网管不能联联机。AP的的两个 NODE之间间交替REBOOT,最终终 会导导致两节节点UNDEFINED状 态态。 可能原因:1、数据盘镜盘镜 像故 障 raidutil -L raid 有数据盘盘 节节点状态为态为 Drive Failed 2、磁盘盘空间满导间满导 致统计统计 故障 一般 有相关的统计统计 告警3、。故障处理技术指引处处 理 流 程处理流程如下: 1. telnet 该该网元,在cluster res 起来,但还还没有来得及 循环环reboot时时停掉进进程控制的cluster res ( ACS_PRC_ClusterControl);cluster res ACS_PRC_ClusterControl_0 /off /waitcluster res ACS_PRC_ClusterControl_1 /off /wait 检查检查 告警 alist 检查检查 cluster res ,找出状态为态为 failed的cluster res cluster res |findstr -ive online 若没有failed 的cluster res 进进行第4步;否则转则转 入第5步;故障处理技术指引处处 理 流 程4.检查检查 数据盘盘的镜镜像。(对应对应 有告警mirrored disks not redudent) raidutil -L raid 如果有Drive Failed 的镜像盘,则进 行重建,一般会持续6 小时左右。 若重建失败,则需更换node 5.对对于有failed 状态态的cluster res , 先消除相关的告警后,再将对应对应 的res 进进行offline、online。 eg: 如果由于R盘或S盘满 引起统计进 程停止,则先应删 除无用的文件, 消除硬盘空间告警,在对统计进 程进行重启不能在不作任何相关处理的情况下,直接将failed状态的cluster res 进行 人工online 6.人工重启进进程控制的cluster res cluster res ACS_PRC_ClusterControl_0 /on /waitcluster res ACS_PRC_ClusterControl_1 /on /wait检查检查 系统统状态态 hostname prcstate alist net state cluster nodecluster res |findstr -ive online 故障处理技术指引 故障现现象由于系统统运行故障,有时时 AP节节点并非指示了正确的状态态 。例如ACTIVE边边不能执执行MML,提示为为:“mml only allowed from active node” ,相反在passive却可以 执执行。 处处理流程处理流程如下: 方法一: 1.1、 在APG两个Node上分别别人工停止的Cluster Server 分别telnet上APG的两个Node,执行如下指令:net stop clussvc 1.2、 任选选一边边(通常选选PDC,即Node A)人工启动动 Cluster Serve telnet上选定的Node,执行如下指令: net start clussvc处处 理 流 程1.3、 观观察到选选定的Node上Cluster Server已经经启 动动 执执行指令:cluster res 有结结果显显示即说说明 Cluster Server已经经启动动 1.4、 确定选选定的Node已经经恢复正常的状态态 执执行指令:prcstate(观观察到状态为态为 active) 或cluster node(观观察到选选定的Node状态态 为为UP) 执执行指令:MML(观观察到已经经能够够正常接入CP模式 即说说明状态态已经经恢复正常) 1.5、 在APG另外一个Node人工启动动Cluster Server telnet上该该Node,执执行如下指令: 1. net start clussvc 6、 确定APG两个Node状态态均已恢复正常 1.执执行指令:cluster res(观观察到指令能正常输输 出结结果且所有resource均为为online状态态)处处 理 流 程方法二:(适用于方法一无效的情况下) 1.任选选AP 一边边(例如 B 侧侧)执执行 prcboot -s ,暂时暂时 停掉这这 一边边; 1.在剩下的一边边( A 侧侧)执执行 prcboot , 待系统统起来后,若 CLUSTER 正常,则该侧为则该侧为 一定为为active; 测试测试 MML 及其他的 APG指令,以确认该侧认该侧 正常;在active边执边执 行 fcc_reset other, 强制另一边彻边彻 底重启; 有时时停掉的一边边系统统cluster会自动动起来,这时这时 候也一定要 执执行第3步 1. 检查检查 系统统状态态 hostname prcstate alist net state cluster nodecluster res |findstr -ive online 故障说明及处理流 程 故障现现象由于SCTP层层网络络状态发态发 生改变变而产产生的O2级级告警 告警举举例: SCTP NETWORK STATUS CHANGESAID EP02MG1301RIP 10.26.36.37 处处理流程处理流程如下: 发发送心跳消息即可消除告警。指令:IHSHI:SAID=said, RIP=“rip”;如上诉诉告警信息的例子即可用: Ihshi:said=ep02mg1301,rip=“10.26.36.37”;来消除告警。谢谢!
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号