故障处理思路及案例分析.ppt

上传人:本田雅阁 文档编号:2852585 上传时间:2019-05-28 格式:PPT 页数:89 大小:712.56KB
返回 下载 相关 举报
故障处理思路及案例分析.ppt_第1页
第1页 / 共89页
故障处理思路及案例分析.ppt_第2页
第2页 / 共89页
故障处理思路及案例分析.ppt_第3页
第3页 / 共89页
故障处理思路及案例分析.ppt_第4页
第4页 / 共89页
故障处理思路及案例分析.ppt_第5页
第5页 / 共89页
点击查看更多>>
资源描述

《故障处理思路及案例分析.ppt》由会员分享,可在线阅读,更多相关《故障处理思路及案例分析.ppt(89页珍藏版)》请在三一文库上搜索。

1、1,无线维护篇系列教材之 故障处理思路 及案例分析,中国电信无线维护 岗位认证培训教材,2,学习完此课程,您将会了解:故障分级制度、故障处理流程;故障处理思路, 典型案例分析,等。,目 标,3,故障的分类及定义1,根据影响通信的范围、持续时间和性质严重程度,一般分为重大通信事故、重大故障、主要故障和一般故障。 重大通信事故范围界定主要根据原信息产业部关于发布的通知(2002114号)文件及公司相关规定:移动电话通信阻断超过10万户*小时。,4,故障的分类及定义2,重大故障:造成通信大面积中断或计费营帐系统大范围差错,引起大量用户集中投诉,造成重大经济损失或不良社会影响的故障。 主要故障:影响范

2、围较大的系统或关键设备发生通信阻断并达到一定时长,影响用户正常使用的故障。 一般故障:除以上所述的其它故障。,5,故障的发现,设备告警:声光电告警、维护终端告警信息、机架机框面板上的告警,等。这是最重要最直接的发现故障的途径。 网管统计性能指标:局部区域的性能指标突然恶化。 DT/CQT现场质量测试:局部区域的质量下降。 10000号,用户投诉申告,等。 对端局、或其他运营商的申告,等。,6,故障处理原则和要求1,故障处理的首要目标为尽快恢复业务。 各级运行维护部门应遵循“先疏通,后排障;先抢通、后处理”的基本原则。首先判明故障区段、部位,尽快按设备、电路重要程度,“先省际、再省内、后本地”,

3、在优先级较高的重要系统、电路阻断而又无备用、迂回路由可倒换的情况下,可以中断优先级较低的系统和电路,优先抢通优先级较高的重要系统和电路。 遵循“先局内,后局外;先本端,后对端;先交换(无线)后传输;先网内后网外”的原则,按照具体路由接续方式,查清障碍段落。当故障情况涉及多个分公司时,按“故障所在局负责”的原则操作。,7,故障处理原则和要求2,在处理故障时,必须对现场各种告警信息、故障显示、故障记录报告等进行认真分析处理,一般应不影响正在通话的用户或任意扩大影响范围,并严格按照各设备厂商提供的故障诊断手册、设备操作手册等规定的命令和操作方法进行处理。 在处理故障时,未经上级运行维护部门同意,不得

4、擅自对交换机、基站控制器、PDSN/FA、AAA(AN-AAA) SERVER、DNS/NTP SERVER、G&C网关等关键设备进行重启,以免造成更大范围的影响。 遵循日常预防维护为主,应急故障处理为辅的管理原则,通过建立故障预警机制,对各种可能引起故障的因素做到“早发现、早处理、早上报”。,8,故障的业务恢复时限,参考时限如下: 重大通信事故和重大故障:应不超过1小时;移动电话通信阻断超过10万户*小时。 主要故障: 不超过4小时; 一般故障: 不超过1天。 对于无线侧基站等设备故障,应区分设备重要程度等级,可遵循以下参考时限: 重要基站:不超过6小时; 普通基站:不超过24小时。,9,故

5、障的责任界定,故障的责任追究将遵循“四不放过”的原则:故障原因不查清不放过;故障处理不完成不放过;整改措施不落实不放过;故障教训不汲取不放过。 一般故障,由分公司运行维护部负责对故障进行责任界定。 主要故障、重大故障,由省网运部根据故障的实际状况进行责任界定。必要时,将组成联合调查组赴故障现场进行调查取证。 重大通信事故,由集团会同省分公司相关部门,或经集团授权,由省分公司相关部门组成联合调查组,进行现场调查取证,进行故障责任界定。 经界定因设备原因而引发的严重以上故障,由省网运部会同相关维护责任部门、相关分公司,与设备厂家一起进行故障善后处理。,10,故障分析制度,各类设备出现故障,都应做好

6、详细的记录,并定期对故障现象和处理情况进行汇总统计。 设备故障记录内容应包括故障现象、故障类型、故障起始时间、故障修复时间、故障历时、故障原因分析、故障处理情况及责任分析、故障处理人等。 汇总统计时应根据故障类型,对各类问题进行汇总。对涉及设备质量方面的问题,应及时向有关部门报告。 对故障进行汇总,按故障产生的原因可分为电源、传输、软件、硬件、局数据设置错误等几类,如相同原因障碍频繁出现,应组织分析并提出解决措施。,11,故障分析制度,本地网必须将故障分析列入每月通信质量分析例会的主要内容。对一个月来出现的所有故障进行汇总、归类统计,对故障原因进行分析,纳入月度质量分析报告上报省网运部。 对于

7、疑难故障,由省网运部组织支撑专家和设备厂家技术人员进行技术深层次分析,收集相关原始数据、告警信息等,澄清关键技术参数,提出疑难故障的预防措施。,12,常用故障处理方法,对比法 替换法 排除法 流程图分析法 信令分析法 呼叫观察分析法 详单分析法,13,对比法比较简单,只要把出故障的数据配置或设备,与正确的设备或数据相比较,找到不同点,进行分析解决问题。,常见故障处理方法:对比法,14,替换法是一种简单实用的故障排除法,对于出现故障的硬件或单板用同样功能(最好是同样型号)正常使用的板件替换掉,如果替换后问题消失了,那就是这个板件的问题。,常见故障处理方法:替换法,15,最小系统法就是去掉系统中的

8、其他硬件设备,只保留最简单的部件,观察最小系统是否有故障。如果有,则可排除其他硬件的问题,而故障来自于现有的几个硬件中。如果没有,则将其他硬件一一添加,查看在添加哪个硬件后出现故障,发现故障所在后,将它更换即可。例如系统中许多重要单板是主备份工作的,在检查问题时可以用一套作为主用,对备用侧进行诊断测试。,常见故障处理方法:最小系统法,16,流程图分析法是对故障相关或经过的软件或硬件用软件流程图或硬件流程图来分析和定位故障,逐个断点,逐段分析 。 例如对于单通问题的定位,需要逐个检查各级传输设备、各级交换网卡、声码器、甚至终端问题等。,常见故障处理方法:流程图分析法,17,信令分析法是一种在局间

9、局内业务对接、调试中最基本的方法,通过信令分析来确定问题的所在。由于信令有统一的标准性,所以能准确的定位问题 。 在无线侧主要的信令是七号信令、各种A接口信令、A-BIS接口信令、空口信令。 无线设备厂家的网管系统,一般都可以进行信令的监视,但大量的监视有可能造成设备过载。可以使用专门的信令检测仪进行监视、分析。,常见故障处理方法:信令分析法,18,多数无线设备厂家的网管系统可以定义对象进行呼叫观察、或业务观察。 对象可以是某些用户、中继接口、或呼叫失败码(原因)等。 对每一次失败呼叫都有相应的失败码和失败原因值,通过对失败码的解释就可以方便地定位故障原因。,常见故障处理方法: 呼叫观察分析法

10、,19,常见故障处理方法:详单分析法,详单CDL/CDT功能是一种高级的故障分析手段。 CDL:CALL DETAILED LIST. CDT:CALL DETAILED TRACE. CDL/CDT是一个可以24小时开启,能够跟踪当前接入系统的所有用户的关键性数据,记录每个呼叫的详细信息,数据采集自动、全面、可定制。 CDL/CDT功能,不仅能监视各种接口的信令流程,还可以监视系统设备内部的处理流程及内部资源的占用情况,是全面、高级的流程分析工具。,20,故障处理知识点的要求,对硬件结构的充分了解。 对各级设备配置、数据设置的充分了解。 对各接口的协议、信令流程的充分了解。 各种仪器仪表的熟

11、练使用。 故障处理经验的积累、交流。,21,案例1:单通处理1,单通是指链路建立后,通话双方不能正常进行通话,即其中一方可以听到另一方声音,而另一方听不到声音的现象。按照问题发生的位置可以分为BSS侧单通、传输单通以及MSC侧单通,按照问题产生的局向可以分为局内单通、局间单通。 发生单通的可能原因: 直放站覆盖区的单通。 E1/T1 物理链路接错引起。 局间电路问题。两端CIC是否匹配。两端CIC错开,引起单通。 声码器。 终端问题。,22,案例1:单通处理2,一般情况下,通话过程中出现单通的问题和MSC侧、BSC侧和终端都可能有关系。 在系统侧,根据MSC和BSC系统结构原理,出现单通和串话

12、的原因和以下单板存在关系:声码器单板、后背板和MSC侧的中继接口板、交换网板、模块间的E1中继接口板、A口E1电路等。,23,案例1:单通处理3,单通原因终端问题: 如果某一用户反映单通现象频繁,而该区域其它用户没有出现类似情况,则很可能是终端问题,可以采用更换终端的方法解决。从前方反馈回来的情况看,某些1.9G手机容易出现单通问题,主要原因是手机与基站的协议配合问题。出现单通时,手机上报的几乎全是1/8速率帧,而没有全速率的语音帧 。,24,案例1:单通处理4,排除单通类的故障,一般需要进行大量呼叫测试,跟踪每次呼叫的资源占用情况:CE,声码器、中继、等,查找规律,定位问题。 单通原因声码器

13、问题 对于声码器问题的排查,可以通过指定BSC侧声码器进行拨打测试来实现,若存在问题,更换相应的问题单板即可。,25,案例1:单通处理5,单通原因直放站覆盖区的单通 由于无线上下行链路的不平衡导致单通,这种现象多出现在直放站覆盖区。 对于直放站,有如下关系式:ROT 1 (1/NIM)。其中:ROT(Rise Over Thermal)热噪声增加量;NIM(Noise Injection Margin)注入噪声裕量。 可以看出,基站接收机输入端热噪声的增加量ROT决定了直放站反向链路对施主基站反向链路的影响,即NIM值越大,直放站在施主基站接收端引起的噪声增加量ROT越小,反之则越大。而NIM

14、取决于直放站反向链路增益G,G值越大,NIM越小,导致ROT增大,使得施主基站的接收灵敏度降低。此时,处于直放站覆盖区边缘的用户,在接入成功后发生单通的概率增加。此类单通的特点是到所有局向都有可能发生,且具有明显的地域性。,26,案例1:单通处理6,单通原因A口电路问题 A口电路指的BSC与MSC之间的传输电路。A口电路上行或下行链路故障或是中继线连接错位都可能导致单通。由于NO.7信令采用共路信令的工作方式,信令的传送与话路是分开的,因此会出现信令传输正常,而话路不通或者话路单通的现象,通常这类现象是由于中继线路连接错误所引起的。 A口电路问题则比较容易复现,而且只要占用同一条电路就会重现单

15、通现象。在条件许可情况下闭塞部分电路,这将有利于故障重现,由于一般出现问题往往是整个E1故障,也就比较容易定位。需要注意定位故障后应尽快解闭塞的电路,不要长时间影响用户通信。 A口故障单通测试也可以借助BSSAP信令跟踪,当有单通现象时,可以通过AssignReq消息中的CIC来确定A口电路具体位置和BSC所对应的声码器单板。 A口电路出现问题后,单通现象产生的概率很大。假设一个交换局有80条E1和BSC相连,若有一路E1出现问题导致单通,则单通概率将是1/80=1.25。因此可以通过对产生几率的统计,来判断A口电路是否存在问题。 在找出问题电路后,应该从工程方面入手,仔细检查电路是否存在物理

16、损伤、接头松动或连接错误。如果只是个别时隙存在问题,则应该检查问题时隙的数据配置情况,主要是CIC描述是否一致。,27,案例1:单通处理7,单通原因MSC侧交换网板、FBI光接口板故障 该类型故障的起因是交换网板、FBI光接口板部分HW线故障。判断条件是到所有局向或跨模块出现单通现象。 处理单通问题时,在排除A口电路故障问题后,网板、FBI光接口板将是重点怀疑对象,因为网板、FBI光接口板是到大部分局向的共路部分。可以通过诊断测试工具检测是否存在高误码,也可以通过倒换网板、FBI光接口板检测。,28,案例1:单通处理8,单通原因局间电路问题: 对于有特定局向的单通,我们可以直接着手局间电路的调

17、查。方法与A口问题的排查类似,主要通过拨打测试和话路监听来实现。此外,由于互联互通问题导致的单通也屡见不鲜,对于这一类问题的排查,我们可以使用信令仪,跟踪单通发生时占用电路时隙的编码语音数据帧。若单通方向上电路时隙填充的编码语音数据帧为固定码流,则可以定位互联互通导致了单通的发生。 解决局间电路单通的步骤是: 1.确定单通的局向 2.确定单通的方向 3.确定单通的电路 1)通过动态观察,找出故障电路所在PCM; 2)根据PCM号对电路,即由出现问题的双方先进行自环,以确定本端的2M中继端口是否正常; 3)确定本端2M中继端口正常后,由双方拔插中继端子TX,确定电路顺序是否正确,以判断故障在哪端

18、。 4)出现故障的TX端DDFSDHSDHDDFRX端的顺序进行查找。,29,案例2:静音处理1,静音是指收发双方均停不到对方声音,产生的原因是收发电路接错。对于此类问题的分析,可以通过呼叫路由,确定一个呼叫可能涉及的各段电路。通过投诉、测试判断静音的影响范围,查找出现静音现象的共性问题,缩小查找范围。 静音问题的处理与单通处理类似。 导致静音的几种情况是:A口电路故障,网板、FBI板故障,出局中继故障,网路中间环节问题。,30,案例2:静音处理2,静音原因A口电路故障 起因:可能是A口电路接错或数字中继单板或声码器SVICM板故障造成静音。 判断条件:到所有局向多出现静音现象。 测试方法:如

19、果是A口电路故障则比较容易复现,其中如果是接错电路则最少会有2条E1出现静音,复现概率非常高,而且只要占用同一条电路就会重现静音现象。在条件许可情况下闭塞部分电路,这将有利于故障重现,由于出现问题往往是整个E1故障,也就比较容易定位。需要注意定位故障后应尽快解闭塞的电路,不要长时间影响用户通信。 A口故障单通测试也可以借助BSSAP信令跟踪,当有静音现象时,可以通过AssignReq消息中的cic来确定A口电路具体交换数字中继DT物理位置和BSC所对应的声码器SVICM。,31,案例2:静音处理3,静音原因网板、FBI光传输接口板故障 起因:可能是网板、FBI板部分HW线故障。 判断条件:到所

20、有局向或跨模块出现静音现象。 测试方法:在排除A口电路故障问题后网板、FBI板将是重点怀疑对象,因为网板、FBI板是到大部分局向的共路部分。可以通过诊断测试工具检测是否存在高误码,也可以通过倒换网板、FBI板检测。 另外,该类测试时可以通过版本的“接续观察”功能来跟踪所占用的网板、数字中继DT等时隙。 静音原因出局中继故障 起因:可能是出局中继电路接错或者是数字中继DT板问题。 判断条件:只到特定的局向呼叫才出现静音现象。 测试方法:可以通过指定呼叫功能测试每一条到该局向的电路;通过TUP信令跟踪单用户,在静音现象发生时以信令消息中的CIC电路号确定具体的物理位置。,32,案例2:静音处理4,

21、静音原因网络中间环节问题: 可能是互联互通的某一环节出现问题导致静音。 判断条件:只到特定的局向呼叫才出现静音现象,而且测试过程中出现静音现象的电路不固定在某一条电路上,是随机出现的。可能这次静音下次占用却正常的现象。 该类问题最好的方法采用E1测试仪,在静音时通过侦听确定问题源头,33,案例3:串音问题1,串音是指通话一方或双方在通话过程中听到第三方话音的问题。 引起串音的原因有很多,但最有可能的原因是数字中继DT板故障。该问题的分析方法是分析呼叫的路由确定一个呼叫可能涉及的每一段电路。通过投诉、测试判断串音的影响范围,查找出现串音现象的共性问题,缩小查找范围。可以通过大量呼叫、指定呼叫(只

22、针对出局的TUP电路)、诊断测试工具、误码仪、E1测试仪进行测试,确定问题所在。 导致串音的主要几个原因有:数字中继DT板故障,网板或FBI板故障和网络中间环节有问题。,34,案例3:串音问题2,串音原因数字中继DT板故障 判断条件:如果是DT板故障则比较容易复现,且复现概率非常高。在条件许可情况下闭塞部分电路,这将有利于故障重现,但出现问题不一定是整个E1故障,因此需要逐条电路测试。需要注意定位故障后应尽快解闭塞的电路,不要长时间影响用户通信。 另外,通过TUP信令跟踪单用户,在串音时以信令消息中的CIC电路号确定具体的物理位置。 串音原因交换网板或FBI光接口板故障 网板或FBI板的HW线

23、故障可能会导致串音。可以通过倒换网板和FBI板检测。,35,案例3:串音问题3,串音原因网络中间环节问题 可能是互联互通的某一环节出现问题导致串音。 判断条件:对于类似问题,最有效的方法是采用E1测试仪,直接判断问题是对端是串音的根源。,36,案例4:回声问题1,回声是指通话一方或双方在说话时可以从听筒中听到自己说话的声音,而且有一定的时延。 回声问题包括:声学回声,电学回声。 终端质量不好容易引起声学回声。 传输时延过大,容易引起电学回声,特别是长途呼叫时。需要估算长途呼叫时的传输时延、软交换时延等。在移动用户呼叫固网用户时比较明显。 某些厂家的设备能提供录音功能,在处理语音质量方面的问题时

24、,可以在多个设备点对语音录音,逐段对比分析,最总定位问题。这是一个常用且比较有效的手段。 该类问题的分析方法是分析呼叫的路由确定一个呼叫可能涉及的每一段电路。通过投诉、测试判断回音的影响范围,查找出现回音现象的共性问题,缩小查找范围。可以通过大量呼叫、指定呼叫(只针对出局的TUP电路)、诊断测试工具、误码仪、E1测试仪等进行测试,以确定问题所在。,37,案例4:回声问题2,回声问题的主要原因: A口电路自环了; 出局电路自环了; 未设置回声抑制软件开关; 未启用具有回声抑制功能的电路板,或回声抑制电路板故障。 终端问题。,38,案例4:回声问题3,回声原因A口电路自环 判断条件:双方多听不到对

25、方的声音,且回音的声音非常大。到所有局向多出现回音现象。 测试方法:这类问题比较容易复现,复现概率非常高,而且只要占用同一条电路就会重现回音现象。在条件许可情况下闭塞部分电路,这将有利于故障重现,由于出现问题往往是整个E1故障,也就比较容易定位。需要注意定位故障后应尽快解闭塞的电路,不要长时间影响用户通信。 A口电路故障测试也可以借助BSSAP信令跟踪,当有回音现象时,可以通过AssignReq消息中的CIC来确定A口电路具体交换DT物理位置和BSC所对应的SVICM。,39,案例4:回声问题4,回声原因出局电路自环: 判断条件:双方多听不到对方的声音,且回音的声音非常大。只到特定局向多出现回

26、音现象。 测试方法:通过指定呼叫测试,由于自环造成整个E1出现回音,因此只需测试每条E1中的一条电路即可。 对于出局电路自环,除物理检查外也通过TUP信令跟踪单用户,以信令消息中的CIC电路号确定具体的物理位置。,40,案例4:回声问题5,回声原因回音未进行软件消除设置 在与固定局对接过程中,由于电话网络中2/4线转换混和线圈阻抗不匹配造成的“回波效应”,四线“收”的信号没有完全转换到二线,而部分泄漏到四线“发”造成混合回音。在移动通信中,回音通路时延一般大于30ms时,通话者将听到自己的回音,影响通话效果。所以当与固定电话网连接时,必须要采取回音消除手段,消除回波效应。 因此当到某一局向(电

27、信等固定网络)出现大量回音问题时,需要检查MSC的“配置管理中继电路组指示器”是否选择“包含回声抑制”;需要检查MSC的“配置管理出局路由基本属性”是否选择“需要来话回声抑制”和“需要去话回声抑制”。,41,案例4:回声问题6,回声原因回声抑制板故障 判断条件:双方能够多听到对方的声音,且回音的声音比较轻。由于目前只在出局方向配置回声抑制板,因此这类问题出现在MS呼叫PSTN或出局呼叫才会发生。 测试方法:可以通过指定呼叫功能测试每一条到该局向的电路。另外通过E1测试仪也可以判断回音产生的源头是否是来自MSC内部。 回声原因终端问题 部分低价终端由于本身的质量问题,会出现通话时回声的现象。该类

28、问题的特点是只用个别用户通话时有回声问题,该区域内的其它用户无此种情况。,42,案例5:语音质量断续、模糊,CE/SVE问题的排查。逐个呼叫,观察占用CE/SVE时的语音质量情况。 邻区漏配或在列表中的位置靠后。相邻小区PN在邻区列表中的位置,如果位置过于靠后,会导致手机搜索不到该导频,该导致成为干扰源而引起通话质量严重下降,甚至掉话。 外部干扰。外部干扰一般对反向链路干扰比较严重。反向链路受到干扰时,会导致在手机接收功率良好的情况下,反向误帧率升高,通过反向开环功率控制要求手机提高发射功率,最终导致手机在距离基站很近、接收功率较强的地方还需要超强的发射功率。由于CDMA是一个自干扰系统,距离

29、基站这么近还有异常高的TX,这对于其他CDMA手机而言又是一个干扰源。 终端问题。特别是一些低价终端。,43,案例6:掉话,掉话的定义:在指用户在通话过程中,由于非人为因素的异常中止。 引起掉话的主要原因: 设备故障引起掉话;重点关注TRX、CE 单元、声码器单元、传输线路等是否存在问题。 数据配置错误引起掉话;特别是邻区漏配,搜索窗设置过小。 弱覆盖引起掉话; 导频污染引起掉话,包括相邻基站功率异常(比如突然升高); 传输误码; GPS时钟问题; 资源故障(无线资源、信道单元和声码器单元、地面链路)不足; 反向干扰(持续干扰、突发干扰); 直放站异常影响; 工程施工问题:天线接反、跳线没有接

30、或是接触不好、天线朝天等,44,案例7:外部干扰的排查,外部干扰一般来源于: 1、直放站。反向增益太大,导致基站反向RSSI升高。 2、大功率对讲机、加油站会议室手机信号屏蔽设备、门禁系统、有线电信信号等。 3、大功率发射设备的第N次谐波落在了C网的反向频段内。例如:微波、寻呼台等。 4、公安局、国安局等国家机构的宽频屏蔽网。 5、C/G共站时天线隔离度不足,造成对C网信号的干扰。 排查外部干扰的工具:使用YBT250或频谱仪对干扰源进行信号追踪。,45,案例8:资源不足拥塞处理,CE资源不足。检查方法:忙时CE占用峰值与实际配置数量比较。 传输资源不足。检查方法:忙时占用峰值与实际配置数量比

31、较。一般传输资源的利用率达到70时,必须增加传输资源。 Walsh Code资源不足。检查载扇的Walsh Code资源占用情况。如果该载扇下的用户数过多,则有可能导致Walsh Code资源不足的情况。可能的原因有该载扇覆盖区域过大而话务过大、软切换比例过高、或该载扇本身就处于高话务区域、或高速数据用户多。 前向功率资源不足。没有足够的前向功率资源来支持起呼, 或反向链路负载过高, 或反向功率过载,从而导致扇区拒绝终端呼叫请求,引起拥塞。可能的原因有:基站的确承载很高话务量;基站软切换和更软切换比例相对较高。,46,案例9:DO上网速率慢,覆盖问题; PRL没有更新,导致上了1x网络 ; 拨

32、号软件。有时使用终端自带的拨号软件测试,可能看到1x和DO都没有信号,此时需要关注终端驱动是否正确安装。 导频污染问题。对于高层建筑用户投诉,由于无线传播的复杂性,需要关注周边宏基站,注意邻区关系的配置、方向角、下倾角等,尽量减小导频污染。 传输资源问题。地面链路传输资源实际可使用的资源不足,或配置足但有故障或误码高。 WALSH码资源不足。 终端问题,例如MEID开关未打开导致EVDO终端不能上网 。 DO-QOS开关是否打开进行限速,用户等级。 是否多个用户(帐号)共有一个IMSI。 DO用户多,导致上网速率慢,需要扩容。 过载问题。PCF是否过载,PCF以上的上层路由是否配置为最短路由。

33、,47,案例10:光纤直放站时延过大(广东电信案例),光纤直放站时延过大,会出现通话质量严重下降,并随时有可能掉话。 时延过大时,基站无法正确判断切换目标基站的导频偏置。基站判断导频偏置是根据移动台上报的导频相位最接近的那个导频偏置来判断切换目标基站导频偏置。如果传输延时导致的相位差足够大,以至距离相邻偏置更近时,基站就会判断错误。从而导致切换失败。,48,案例10:光纤直放站时延过大,理论分析:直放站光纤长度前向首先受限于Pilot_inc 假设Pilot_inc=3,那么光纤直放站的传输距离必须小于:(3/2)*64chips*(244m/chip)/1.5 = 15616米。也就是说光纤

34、直放站的距离限制在Pilot_inc为3时,最多只能拉15.6公里。 而实际上直放站有一定覆盖范围,其信号到达手机时还会有一定传输时延。以光纤直放站覆盖范围为5公里为例,由于光或电磁波在空气中传播5公里相当于在光纤中传播52/3公里,所以其光纤长度最大应为1552/3=11.7(公里),而直放站的站下时延必须小于965000/244=75.5(chip)。 此外,光纤直放站的光纤长度还受限于SRCH_WIN_N/2 当Pilot_inc=3时,SRCH_WIN_N最大只能是12,即160个chip,因为当SRCH_WIN_N为13时,对应于226个chip,而为了不会出现搜索混乱,搜索窗宽度必

35、须小于等于192(3*64)个chip。当SRCH_WIN_N为12时,SRCH_WIN_N/2就是80个chip,设直放站覆盖范围是5公里,其光纤长度最大只能为80244/1.550002/3=9.68(公里),直放站的站下时延必须小于805000/24459.5个chip。,49,案例11:直放站的自激,直放站的增益不宜过大。开通之后,必须进行一定次数的呼叫测试。因为直放站的自激不是每次呼叫都发生,特别是上行(反向)。 克服自激现象的方法有两种:一是增大施主与重发天线的隔离度;二是降低直放站增益。当要求直放站覆盖范围较小时,可采用降低增益的办法。当要求直放站的范围较大时,应增大隔离度。工程

36、中主要采用以下几种方法:增大收发天线的水平及垂直距离;增加遮挡物,如加装屏蔽网等:增加施主天线的方向性,如使用抛物面天线;选用方向更强的重发天线,如定向角度天线;调整施主与重发天线的角度和方向,使两者尽量背向。,50,案例12:RSSI异常(江苏电信春风行动案例),RSSI是否正常,对通话质量、掉话、切换、拥塞以及网络的覆盖、容量等均有显著的影响。 RSSI异常可分为3类,分别是RSSI过低、RSSI过高、RSSI主分级差值过大等。RSSI异常可能会导致相应载扇的指标异常,如:接入成功率低,掉话率高,语音质量差甚至无法接入等。 下表是对RSSI异常出现的3类问题做简单归纳。,51,案例12:R

37、SSI异常(江苏电信春风行动案例),52,案例12:RSSI异常(江苏电信春风行动案例),RSSI涉及到整个上行通道:无线环境干扰,天线,馈线,跳线,接头,基站设备,无线直放站,室内干放,耦合器/合路器,网规参数。 1、工程质量不好导致RSSI异常:如下表,53,案例12:RSSI异常(江苏电信春风行动案例),2、外部干扰导致RSSI异常:,54,案例12:RSSI异常(江苏电信春风行动案例),55,案例12:RSSI异常(江苏电信春风行动案例),4、设备工作异常导致RSSI异常 : 由于设备硬件故障,如天馈、RFU故障等,可能导致反向通道断开或设备产生自激,使RSSI异常。 由于设备工作存在

38、异常,如传输闪断、BTS硬件资源不足、BSC资源分配模块工作异常等,导致大量呼叫失败或被系统拒绝,呼叫失败用户反复发起接入而导致RSSI异常。表现在话统上是网络忙时试呼次数过高(如超过平时3000次以上),存在大量的异常呼叫释放现象。,56,案例12:RSSI异常(江苏电信春风行动案例),5、终端工作异常导致RSSI异常 : 工艺不符合CDMA行业标准的移动台、固定台(FWT),在接入网络的时候,终端会忽略网络下发的功率控制信息,或者系统所下发的功率控制命令对该部分终端无效、执行效果较差。现实网络中,通常会碰到这些非法的手机,或者不符合工艺规范的固定台,提升了网络的底噪。,57,案例13:天馈

39、接错的判断,后台检查发射功率是否正常,如正常说明射频设备没有故障,问题可能在天馈。 现场测试:进行路测,判断小区覆盖区域是否符合设计,多小区覆盖区域是否存在重叠。 该小区实际覆盖方向没有信号,如与其他小区的覆盖方向重叠,可能天馈接错。 从后台的载频邻区切换次数可以验证天馈接错的问题。 现在的鼎利软件可以简单判断发送天线的接错问题。,58,案例14:单载频基站加载频后依然拥塞的处理 (江西MOTO)1,拥塞原因:无线资源不够,导致TCH分配失败,即仍产生了拥塞;SCH高速速率分配失败率非常高。 目前南昌的双载波基站有两个载波,分别是283和201,其中283是基本载频,201是专为数据业务提供服

40、务,并且手机在空闲状态都驻留在283频点,发起呼叫也在基本频点上,最终根据服务类型(语音,数据,短消息等)选择在什么频点上进行服务,数据业务分为三种: 短信业务:短消息长度小于等于6个字节直接在283频点进行传送,否则在201载波; 彩信:所有的彩信业务都在201载波上进行服务; 上传/下载:所有真正的数据业务都在201载波上进行服务。,59,案例14:单载频基站加载频后依然拥塞的处理 (江西MOTO)2,数据业务WALSH码的分配: 一个语音用户分配一条FCH,占用一个Walsh。数据业务,先分配一条FCH,要求高速率时,分配SCH(增补信道),不同速率的SCH,占用的Walsh不同。一般W

41、alsh的分配都是一个子树的分配,即连续的分配,速率越高占用越多的walsh资源。 而walsh码的不足,会导致话务拥塞和接入失败率高,一般是数据业务引起。因为变速率的原因,还和walsh预分配、walsh重组等功能开关是否打开有关。 所以,walsh不足导致语音拥塞和接入失败,首先考虑数据业务的Walsh管理功能开关是否都打开,以分配更多的walsh码给语音业务。,60,案例14:单载频基站加载频后依然拥塞的处理 (江西MOTO)3,【处理方法及建议】 经过专业网管的CDL跟踪发现上网都在283载波上,但是该基站已经扩容为双载波了,故考虑是否将数据业务都放在201载波上承载,而将283做为纯

42、语音载波,以扩大283对语音话务的吸收,和201对数据业务的保证。,61,案例15:修改SCH分配导频门限解决WALSH不足 引起的拥塞(浙江案例),故障现象:呼叫建立成功率较差 ,分配资源失败,由WALSH资源不足引起的拥塞。PS业务用户占用高倍速SCH导致WALSH不足。 临时解决措施:修改基站前反向SCH分配的导频门限值,使高倍速SCH信道分配的导频强度门限提高,用户申请到高倍速SCH的难度增大,从而释放出一定的系统WALSH资源。 但可能影响用户对上网速率的感受。,62,案例16:病毒引起的BSC拥塞处理(江西电信案例),【问题现象】 :部分基站出现有信号打不了电话的情况,手机提示为网

43、络忙,但挂机后重新拨打几次又可以正常使用,半小时后其它县的一部分基站也相继出现相同问题。 【处理步骤】 核查基站无线资源使用情况 ,排查基站RSSI处于正常范围内。都正常。 检查同一BSC下多个基站出现拥塞,怀疑为BSC问题。 出现Ce license使用率过高的信息 。对系统license进行核查,核查发现前台校验license文件失败,校验结果无效,BSC进入基本配置,部分信道资源被锁定,从而进一步导致部分基站的反向ce资源受限,特别是一些高话务的站点。 申请及加载新的 license文件后,拥塞消失。 最终故障原因是由于BAM病毒引起license文件损坏,从而导致校验无法通过(BSC系

44、统每天凌晨会定时对比校验license文件的有效性),使得license失效,部分反向CE信道资源被锁死,系统进入基本配置状态。,63,案例17:反向接入信道故障引起的 用户无法接通的申告,该站其他扇区的业务正常,仅第三扇区的业务不正常,但无线信号正常。 检查内容:小区数据配置;MSC侧是否漏做CI数据;第三扇区对应天馈系统及TRX/DPA/RFE等板卡问题;PIM板卡问题;CBM板卡问题。最后发现为CBM板卡问题。 性能统计发现三扇区无接入消息、寻呼响应、位置更新等消息 ,说明反向接入信道存在问题。 检查三扇区接入信道配置,配置数据正常,怀疑第三小区接入信道对应信道单元故障, 将接入信道的序

45、号由287改为288。恢复正常。问题为单个信道单元故障影响业务的使用。 日常应加强对各个扇区的性能统计指标的监控。 遇到问题,应通过对信令、硬/软资源占用情况等分析定位问题。,64,案例18:拔码开关引发的低功率预告警,检查内容: 后台提升功率 ,是否可升? 驻波比是否正常?接线是否松动?天馈是否有故障? HPA、TRX等板件是否有告警?隐形故障?更换备板。 机框背板是否有问题? 机框背板。最后定位为板件的拔码开关误设。 在维护经常遇到某板的内部开关、背板的开关甚至跳线等引起的问题。,65,案例19:E1电路故障,常见问题: 交叉线?自环?阻抗是否匹配?接头是否虚焊? 板卡是否支持E1电路增开

46、?例如板卡只支持4E1,增开4E1,当然失败。 用误码仪测试传输误码,是否存在滑码、误码告警; 检查E1线,DDF架,传输设备等的接地情况。 同步问题 NO7的电路识别码CIC是否两端匹配,状态是否正常?,66,案例20:GPS故障(中兴)1,GPS常见的故障处理 GPSTM单板前面板上共有5个指示灯:RUN绿灯、ACT绿灯、ALM红灯、1PPSALM红灯、GPSALM红灯。正常运行应该是RUN绿灯和ACT绿灯(主用)常亮。 GPS未探测到 前台现象:GPSTM上的ALARM灯常亮,主用CCM板ALARM红灯快闪。 后台告警:为探测到GPS(未收到TOD故障)。,67,案例20:GPS故障(中

47、兴)2,时钟子系统简单如上图所示,蓝色线表示后背板走线,容易出现连接问题而导致各种故障。TCM单板选择备份的两个GPS输出的时钟信号,输出再生时钟信号给RFIM,由RFIM将时钟分发给CHM等单板;同时TCM输出10M信号给FDM,由FDM锁相输出射频单板所需的频综信号。 1、GPSTM只要电源正常、天馈正常即可正常工作; 2、TCM、FDM正常工作需要GPSTM首先正常工作,其次要求CCM对其进行正确配置(通过I2C线缆)。 如上图所示,GPSTM通过422数据线与CCM相连,后台通过CCM对GPSTM进行监控,在基站最小配置: CDSU,CCM,GPSTM(其他单板均可以拔出来),在CCM

48、单板没有故障情况下GPS均可以探测到,与其他单板工作是否正常没有关系。,68,案例20:GPS故障(中兴)3,所以GPS未探测到原因可能有: 1、查单板是否有故障:首先查GPSTM,然后是CCM和后背板; 2、监控通道是否存在故障,主要包括这两层框后背板和数据线是否有故障。 故障处理: 1、更换槽位和单板 首先分别更换GPSTM单板,更换GPSTM槽位,更换CCM单板; 2、检查并拔插后背板连线; 3、更换GPSTM后背板; 4、更换CCM后背板。 步骤4的概率很小,说明是由于BDS框后背板故障导致GPSTM单板监控通道出现了故障,导致GPS未探测到告警。,69,案例20:GPS故障(中兴)4

49、,总结: GPS未探测到是GPS常见故障,其监控路径是: GPSTMCCMBTS-CDSUBSC-CDSU后台,所以在基站侧只与GPSTM和CCM及其通道有关,主要从这几个方面查找故障。 该问题一般都是GPSTM单板本身故障导致,也有可能是后背板上后台未探测到的GPSTM板对应的从GPSTM到CCM板的TOD线有问题。对于5号槽位的GPSTM板,有TOD和从FDM出来的232IIC的合线,如果该线是接头有问题,TCM和FDM也会同时出现未探测到,但该线出问题的概率较小。,70,案例20:GPS故障(中兴)5,GPS处于时延阶段 GPS处于时延阶段,说明GPSTM模块已启动,GPS已探测到天馈但未跟踪到卫星。系统未收到卫星信号或收到的卫星信号弱。重点检查GPS天馈系统接触性能。 前台现象:GPSALARM红灯常亮。 后台告警:GPS处于时延阶段。 故障分析: 导致该故障出现的原因有很多,如:GPS天线、机顶分路器、GPS避雷器、后背板、GPSTM单板故障和馈线上的各接线头做得不好都有可能。该问题我们可以通过测量电压

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1