传输故障分析.do.ppt

上传人:李医生 文档编号:9156780 上传时间:2021-02-05 格式:PPT 页数:62 大小:2.02MB
返回 下载 相关 举报
传输故障分析.do.ppt_第1页
第1页 / 共62页
传输故障分析.do.ppt_第2页
第2页 / 共62页
传输故障分析.do.ppt_第3页
第3页 / 共62页
传输故障分析.do.ppt_第4页
第4页 / 共62页
传输故障分析.do.ppt_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《传输故障分析.do.ppt》由会员分享,可在线阅读,更多相关《传输故障分析.do.ppt(62页珍藏版)》请在三一文库上搜索。

1、OptiX SDH故障分析与处理方法专题,熊世荣 31138,Page 2,前言,基于OptiX SDH故障维护,开发此课程。 本课程旨在通过介绍一些故障定位的方法帮助故障维护人员分析定位故障,通过一些典型的故障来阐述常用故障定位方法的应用。,Page 3,课程目标,学习完此课程,您应能: 掌握故障定位基本思路及方法 掌握SDH 告警分析(常见导致业务中断告警的原因和解决方法) 了解典型故障的分析处理,Page 4,内容介绍,故障处理思路与方法 常见告警分析 典型故障分析,Page 5,故障定位前的准备,掌握专业技能 熟悉SDH原理知识 了解传输系统告警信号流及告警产生机理 熟悉传输设备和网管

2、的基本操作 熟悉常用仪表的基本操作,熟悉工程组网信息 网络拓扑 业务配置 设备运行状态 工程文档 做好故障现场数据的采集与保存,Page 6,故障定位基本原则,故障定位的关键是什么?,将故障准确定位到单站,Page 7,故障定位基本原则,先高速部分,后低速部分,先定位外部,后定位传输,先定位单站,后定位单板,先分析高级别告警,后分析低级别告警,Page 8,故障分析方法,环回法,替换法,配置数据分析法,更改数据配置法,告警、性能 分析法,仪表测试法,经验处理法,Page 9,故障处理方法(告警、性能分析法),通过设备告警指示灯获取告警信息,一、通过机柜顶部的告警指示灯查看告警 二、通过单板告警

3、指示灯查看告警,设备指示灯仅反映设备当前的运行状态,对于设备曾经出过故障,无法表示 设备指示灯状态只能反映设备告警级别,而不能准确告知具体告警,缺点,适用于设备维护人员配合处理故障时使用,Page 10,故障处理方法(告警、性能分析法),通过网管获取告警和性能信息,适用于网管维护人员处理故障使用,全面性,不仅仅是一个站、一块板的故障信息,而且是全网设备的故障信息,详实性,能够获取设备当前存在哪些告警、告警发生时间,以及设备的历史告警;能够获取设备性能事件的具体数值,Page 11,故障处理方法(告警、性能分析法),应用举例,A,B,C,D,R_LOS TU_AIS,MS_RDI HP_RDI

4、LP_RDI,无,无,分析: 因网元B有R_LOS,从而网元A相应光路有MS_RDI、HP_RDI; 因网元B有TU_AIS,并且TU_AIS业务是与网元A业务,从而网元A 相应通道有LP_RDI; 网元B的R_LOS告警会导致TU_AIS; 结论: 所有告警均由网元B的R_LOS引起,说明A到B传输方向光路故障。,Page 12,故障处理方法(环回法),线路,线路,内环回,外环回,SDH网元设备,支路,支路,软件环回/硬件环回 内环回/外环回 线路环回/支路环回 端口环回/VC4环回,线路环回可能导致 该线路其他在用业务中断,部分单板不支持软件的VC4环回,请查阅相应的使用手册,Page 1

5、3,4.初步定位单板问题,“环回法”的步骤:,1.环回业务通道采样,2.画业务路径图,3.逐段环回,定位故障站点,故障处理方法(环回法),Page 14,故障处理方法(环回法),一、环回业务通道采样:,1、从多个有故障的站点中选择一个站点; 2、从所选择站点的多个故障业务通道中选择其中的一个业务通道。由于自环第一个VC4通道,可能会影响ECC通信,因此尽量不要选择第一个VC4通道内的业务。,Page 15,故障处理方法(环回法),画出所采样业务一个方向的路径图。 在路径图中表示出:该业务的源和宿,该业务所经过的站点,该业务所占用的VC4通道和时隙。,二、画业务路径图:,例如:,Page 16,

6、故障处理方法(环回法),依据中断业务的路径图,在3号站第1块支路板的第1个2M通道外接一个2M误码仪,监测业务好坏。,三、逐段环回,定位故障站点,四、根据环回现象初步定位故障单板,Page 17,故障处理方法(替换法),适用场合,排除传输外部设备的问题 故障定位到单站后,怀疑单站内单板或附件有 问题,替换法就是使用一个工作正常的物件去替换一个 被怀疑工作不正常的物件,可替换物件包括线缆、光纤、法兰盘、电源、单板、设备等。,Page 18,故障处理方法(替换法),应用举例,业务配置:2-PQ1板63个2M配置双向业务到5-S16做 单站调试,使用设备为2500+。 故障描述:2-PQ1板第40个

7、2M上报T_ALOS告警,其他2M通 道正常。通过网管对第40个2M做内环回,T_ALOS消失。DDF架 环回故障依然存在。,Page 19,故障处理方法(配置数据分析法),适用场合,故障定位到单站后,用以进一步定位故障 特定告警,如:HP_TIM、HP_SLM等,HP_TIM:J1字节设置 HP_SLM:C2字节设置 TU_AIS/AU_AIS:SDH业务配置 TPS倒换下业务中断:检查TPS保护设置 MSP环倒换下业务中断:MSP节点参数设置 SNCP环倒换下业务中断:通道保护属性设置,Page 20,故障处理方法(配置数据分析法),A,B,C,应用举例,VC4,(开销穿通),(开销终结)

8、,(开销终结),HP_SLM,分析: 1、HP_SLM告警与C2字节相关,为实收C2与应收C2不匹配; 2、网元B开销穿通,对C2字节做穿通处理; 处理步骤: 1、检查网元C接受方向的应收/实收C2字节; 2、检查网元A发送方向的应发C2字节;,Page 21,故障处理方法(更改配置法),适用场合,有空余时隙、通道或槽位 一个VC4中部分时隙业务中断情况,更改时钟配置:时钟告警、指针调整 更改板位配置:怀疑单板或是母板槽位故障 更改时隙配置:将故障定位到单站 判定线路或支路故障 更改单板参数配置:以太网故障、对接故障,Page 22,故障处理方法(更改配置法),故障描述: 1、网元C收网元A方

9、向所有2M业务中断; 2、其他网元业务正常; 可能原因: C站PQ1故障 A站3-PQ1故障,应用举例,A,B,C,D,2-PQ1:30E1 3-PQ1:40E1 3-PQ1:20E1,30E1,1VC4:130,40E1,2VC4:140,20E1,2VC4:4160,TU_AIS,LP_RDI,w,w,w,w,e,e,如何将故障 定位到单站?,Page 23,故障处理方法(更改配置法),配置一条从网元A到网元B的E1业务,使用第二个VC4,应用举例,A,B,C,D,2-PQ1:30E1 3-PQ1:40E1 3-PQ1:20E1,30E1,1:VC4,40E1,2:VC4,20E1,2:V

10、C4,TU_AIS,LP_RDI,w,w,w,w,e,e,网元B有TU_AIS,无任何告警,网元A PQ1板故障,网元C PQ1板故障,Page 24,故障处理方法(仪表测试法),适用场合,排除传输设备外部问题 设备对接问题 设备性能指标问题,光功率计:R_LOS、R_LOF 万用表:接地或是电压问题 SDH分析仪:误码等问题,Page 25,故障处理方法(仪表测试法),故障描述: B站收R_LOS 可能原因: A到B方向光纤故障 A站光板发送故障 B站光板接收故障,应用举例,A,B,R_LOS,w,w,测试A发送光功率,异常,A站光板发送故障,测试B接收光功率,正常,正常,异常,B站光板接收

11、故障,A发B光纤故障,Page 26,故障处理方法(经验法),适用场合,仅做为应急处理时使用,临时恢复业务,复位单板 单站重启 重新下发配置 将业务倒到备用通道,该方法不能彻底查清故障原因,除非不得已,建议使用其他方法,Page 27,故障处理方法,Page 28,本节我们主要学习了: 故障处理基本思路 故障处理各种方法及其比较,小结,Page 29,内容介绍,故障处理思路与方法 常见告警分析 典型故障分析,Page 30,设备常见告警分析,SDH接口板常见告警,SL64、S16、SL4、SLQ4、SD4、SL1、SQ1、SQE 等单板,1,.,R,-,L,O,S,告,警,:,接,收,侧,数,

12、据,信,号,丢,失,,,是,最,常,见,的,告,警,。,一,般,是,光,纤,断,或,光路衰耗过大。,2,.,R,-,L,O,F,告,警,:,在,接,收,端,检,测,到,定帧,字,节,A,1,f,6,H,、,A,2,2,8,H,,,说,明,接,收,侧,帧同,步,丢,失,。,一,般,由,光板,故,障,或,光,路,故,障引,起。,Page 31,设备常见告警分析,SDH接口板常见告警,Page 32,设备常见告警分析,SDH接口板常见告警,5,.,M,S,-,A,I,S,告,警,:,检,测,接,收,到,的,复,用,段,开,销,字,节,K,2,(,b,i,t,6,、,7,、,8,),=,1,1,1,时

13、,,,上,报,此,告,警,。,告,警,含,义,是,整,个,S,T,M,-,N,帧,内,除,S,T,M,-,N,R,S,O,H,外,全,部,为,“,1,”,。,一,般,由,R,-,L,O,S,告,警,引起或上游站传递过来。,6.MS-RDI告警:,检,测,接,收,到,的,复,用,段,开,销,字,节,K,2,(,b,i,t,6,、,7,、,8,),=,1,1,0,。,一,般,由,下,游,站,回,告,上,来,,,表,示,下,游,站,接,收,到,的,本,站,信,号,有,故,障,,,说,明,本,站,至,对,端,线,路板之间有问题。,Page 33,设备常见告警分析,SDH接口板常见告警,Page 34,

14、设备常见告警分析,9.AU-LOP告警:,检测到AU指针H1、H2字,节非法。常见的是业务时隙,冲突。,10.HP-TIM告警:,高,阶,通,道,追,踪,识,别,符,失,配,告,警,,,一,般,由,两,端,光,板,的,追,踪,识,别,符,不,一,致,引,起,。,该,告,警,不,一,定,影,响业务。,SDH接口板常见告警,Page 35,设备常见告警分析,PDH接口板常见告警 PQ1、PD1、PL3等单板 1.TU-AIS告警: VC-12和TU-12指针全部为“1”。一般由线路板、交叉板或支路板故障引起,或者业务故障。 2.LP-RDI告警: 检测接收到的低阶通道开销字节V5(bit8)=1.

15、一般是TU-AIS告警的对告。,Page 36,设备常见告警分析,PDH接口板常见告警 3.TU-LOP 告警: 检测到TU指针V1、V2字节非法。一般在下时隙配置或新增时隙配置时发生时隙冲突。 4.T-ALOS 告警: 2M模拟信号丢失,一般是未上交换业务或DDF架2M线接触不良,是最常见的告警。 5.PS告警: 保护倒换告警。若支路板设置为保护方式,也会出现此告警,一般发生在通道环上(5.0平台一般无此告警)。,Page 37,设备常见告警分析,交叉板常见告警: 1、PS告警: 复用段保护倒换告警,或TPS发生保护倒换。 2、Hard-Bad: 硬件坏告警,需要及时进行更换。 3、Temp

16、-Over: 工作温度越限告警,影响交叉板正常工作,需及时排除该告警,如清 扫防尘网等 4、MS-SW: 交叉板主备倒换告警(只有2500+设备支持)。 5、W_OFFLINE 拉手条离位告警(只有10G设备支持)。,Page 38,设备常见告警分析,时钟板常见告警: 1、LTI告警: 如果配置了内部源以外的源,但所有的时钟源都不满足被选条件,时钟工作在保持或自由振荡模式,上报LTI告警。 如果是外部命令(强制或人工倒换)倒换到内部源,不上报该告警。 2、SYNC_C_LOS告警: 同步源级别丢失,在非SSM模式下,若配置的时钟源丢失,产生此告警。 3、EXT_SYNC_LOS: 外同步时钟源

17、丢失告警如果优先级表中配置了外部源,当外部源失效后,产生外部源丢失告警。 4、SYN_BAD: 同步源劣化。可能是跟踪的时钟源劣化严重或者交叉时钟板本身故障所致。,Page 39,设备常见告警分析,主控板常见告警: 1、WRG_BDTYPE告警: 配置错误告警。实际插的单板与该板位定义的类型不一致。如公务板位定 义为OHP类型 ,实际所插板为OHP2板。 2、FAN_FAIL告警: 风扇失效或风扇电源未开。需要及时处理。 3、MAIL_ERR: 邮箱故障 。需进一步分析是与那块单板的邮箱通信出现故障,以便及时排 除故障。 4、NESTATE_INSTALL: 网元处于安装态,需要重下配置解决。

18、,Page 40,设备常见告警分析,复用段相关告警: 1、APS_INDI: 保护倒换指示,说明网络上发生了复用段保护。 2、APS_FAIL: 保护倒换失败指示,需查询复用段参数、协议状态等信息来进一步定位倒换 失败的原因。 3、APS_PARA_ERR: ECC复用段校验时,如果节点参数不正确会上报复用段节点参数校验失败。 4、APS_TYPE_ERR: 复用段协议类型不匹配,需要统一全网复用段协议类型。,Page 41,本节我们主要学习了: 常见告警的分析(产生原因以及相应的解决方法),小结,Page 42,内容介绍,故障处理思路与方法 常见告警分析 典型故障分析,Page 43,业务中

19、断类故障,外部原因 供电电源故障 接地故障 环境异常 光纤、电缆故障 人为原因 误操作设置了光路或支路通道的环回 误操作更改、删除配置数据,设置业务未装载 设备本身故障 单板失效或性能不好,可能原因,Page 44,业务中断类故障,定位方法,告警分析法 更改配置法 逐段环回法 替换法,定位步骤,检查各站登录是否正常 检查有无设备告警,如BD_STATUS、NO_BD_SOFT等 检查保护倒换是否正常 分析故障,通过环回或是更改配置定位到单站 将故障进一步定位并解决,Page 45,TU_AIS,LP_RDI,网络配置 网元1为中心节点,为网关网元 其他各点之间没有业务,故障描述 网元1和网元4

20、 E1业务中断 节点 4:TU_AIS 节点 1: LP_RDI 其他各站业务正常,无其他告警,t2:1,t2:1,2:1,2:1,2:1,案例1:无保护链,业务中断类故障,Page 46,1,2,3,4,w,w,w,w,E,E,TU_AIS,LP_RDI,t2:1,t2:1,2:1,2:1,2:1,告警查询,网元4有 TU_AIS,网元4不能收网元1业务,网元1、2、3间业务正常,检查1到4的业务配置,告警分析步骤,可否做环回 操作?,正确,业务中断类故障,Page 47,1,2,3,4,w,w,w,w,E,E,误码仪,t2:1,t2:1,2:1,2:1,2:1,对网元2东向 2VC4做内环

21、回,正常,故障点在网元1、2,故障点在网元3、4,在网元3东向对 2VC4做内环回,正常,故障点在网元3,故障点在网元3或网元4,用尾纤在网元3东向做内环回,正常,故障在网元3东向光板,故障在网元4,业务中断类故障,Page 48,1,2,3,4,w,w,w,w,E,E,TU_AIS,LP_RDI,t2:1,t2:1,2:1,2:1,2:1,故障定位到单站,可能LU/TU/XC 故障,业务正常,TU故障,更换TU,XCS主备倒换,TPS 倒换,业务正常,XCS故障,更换XCS,LU故障,更换LU,若无TPS或XCS 主备怎么办?,业务中断类故障,Page 49,业务中断类故障,w,SNCP R

22、ing,e,e,e,e,w,w,w,3,2,4,1,案例2:SNCP 环,网络配置 网元1为中心节点,各点有和网元1的业务 其他各点间无业务往来,故障描述 网元1和网元4间2M业务中断 网元 1, 4: TU_AIS 其他各站业务正常,TU_AIS,TU_AIS,Page 50,告警/性能分析,断开网元1和4光纤,转化为链处理,w,SNCP Ring,e,e,e,e,w,w,w,3,2,4,1,同上一案例,处理方法,检查配置数据是否正确,TU_AIS,TU_AIS,业务中断类故障,先强制倒换以尽快恢复业务,Page 51,w,MSP Ring STM-4,e,e,e,e,e,w,w,w,w,3

23、,2,4,5,1,案例3:MSP 环,网络配置 网元1为中心节点,各站均有到网元1的业务 其他各站之间没有业务 业务均按最短路径配置,故障描述 网元2与网元3之间光纤断 R_LOS 网元1与网元3之间E1业务中断 网元1, 3: TU_AIS 其他业务正常,TU_AIS,TU_AIS,R_LOS,R_LOS,业务中断类故障,Page 52,w,MSP Ring STM-4,e,e,e,e,e,w,w,w,w,3,2,4,5,1,R_LOS,R_LOS,APS_INDI TU_AIS,APS_INDI,S,S,P,P,P,查询告警,检查倒换状态,正常,APS协议是否启动?,是,否,画倒换后的信号

24、流,更换故障单板,重新下发MSP参数配置,倒换状态正常?,否,是,重启APS协议,倒换状态正常,否,是,逐段环回定位故障到XCS/LU,是,否,启动协议,TU_AIS,业务中断类故障,Page 53,业务中断类故障,w,MSP Ring STM-4,e,e,e,e,e,w,w,w,w,3,2,4,5,1,R_LOS,R_LOS,APS_INDI TU_AIS,TU_AIS,APS_INDI,S,S,P,P,P,倒换前路由,倒换后路由,对于比较长的链, 建议采用二分法进行环回,Page 54,误码类故障,可能原因,外部原因 光功率问题 接地故障 环境温度 电缆故障 设备外部干扰(瞬时大误码) 人

25、为原因 时钟配置错误 设备本身故障 单板失效或性能不好(交叉、时钟、线路、支路),Page 55,误码类故障,是否所有站都有B1、B2误码,检查环境温度,是,否,时钟/交叉问题,是否仅本站有B1、B2误码,是,光功率问题,检查本站或上游站 光纤、光板,否,是否有高阶B3误码,是,本站或上游站线路/交叉/时钟故障,否,是否有V5误码,是,本站或上游站支路/交叉/时钟故障,否,仪表测试有误码、 性能上报无误码,是,DDF/电缆接地问题,定位步骤,Page 56,误码类故障,网络配置 网元1为中心节点,其他点均与网元1有业务 其他各点之间没有业务,故障描述 网元3东向有大量RSBBE、MSBBE、H

26、PBBE 网元4西向有MSFEBBE、HPFEBBE、LPFEBBE 网元1有LPBBE,?,案例1:无保护链,Page 57,1,2,3,4,w,w,w,w,E,E,LPBBE,LPFEBBE,RSBBEMSBBEHPBBE,MSFEBBEHPFEBBE,排除外部故障 (电磁干扰、 温度),性能事件分析,LPBBE 为1收4误码,RSBBE/MSBBE/HPBBE 为从4到3光路误码,高阶误码导 致低阶误码,继续,故障在3与4之间,告警性能分析,误码类故障,Page 58,1,2,3,4,w,w,w,w,E,E,LPBBE,LPFEBBE,RSBBEMSBBEHPBBE,MSFEBBEHPF

27、EBBE,解决问题,继续,检查3、4风扇和温度,正常,是,否,正常,是,否,替换光纤、接头、法兰盘、单板,用仪表测试光功率(通过性能查询),告警性能分析,替换法,误码类故障,Page 59,1,2,3,4,w,w,w,w,E,E,LPBBE,LPFEBBE,RSBBEMSBBEHPBBE,MSFEBBEHPFEBBE,在网元1接误码仪,在网元3东向做光/电口内环回,环回、替换法,正常,网元4西向光板/XCS,不正常,网元3东向光板/XCS,网元4交叉主备倒换,网元3交叉主备倒换,正常,不正常,XCS故障,光板故障,正常,不正常,XCS故障,光板故障,误码类故障,Page 60,本节我们主要学习了: 业务中断类故障产生原因以及相关故障分析 误码类故障产生原因以及相关故障分析,小结,Page 61,本课程我们主要学习了: 故障定位基本思路和方法 常见告警原因分析 典型故障的分析处理,总结,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 科普知识


经营许可证编号:宁ICP备18001539号-1