1、目录工单流程规范性手机网管操作常见告警分析网络运维体制改革 故障工单派发流转方式的彻底变革传统模式集中运维模式省监控省监控地市公地市公司监控司监控人员人员区县代区县代维人员维人员区县代区县代维人员维人员派 单派 单回 单回 单电话通知故障根据故障工单内容将故障报给片区维护人员,电话督促处理故障,并将处理结果以工单形式回复给省公司。接到报障电话,根据监控人员叙述,到达故障点位处理故障,并将处理情况回复给地市监控人员。手机接单后查看故障详情,处理好故障后,将处理情况回复给省公司。缺点:二次调度,监控人员与处理故障人员沟通存在偏差,反复电话确认耗时长,不利于及时处理故障。,集中故障管理后,取消地市监
2、控,缩短了故障通知环节;通过微网格的划分,将原本较大的维护区域细分为更小区域,由5人左右一组的最小维护班组进行维护,省公司将故障区域定位后,直接将故障工单派发给该区域维护人员,维护人员通过手机工单查看故障详情,不但能更精准的对故障进行定位,还能有效提升维护效率。网络运维体制改革 6月起,成都将现有网络细分为微网格,传输专业基本维持一个区县一个微网格的形式,无线专业划分微网格较多,每个区县有4-5个微网格,全业务专业每个区县划分为3个微网格,每个微网格由5名左右的维护人员组成维护小组,对该微网格进行维护作业。所有工单由一线人员直接接单、故障处理、回复,包括代维和自维,杜绝使用调度人员统一受理并回
3、复的“二次调度”现象,后期将上线GPS功能,对维护人员接单地点进行定位。故障处理配合:根据省公司统一安排改由省公司进行故障配合。因工程割接进行的“工程预约”,不会派发相应工单,所以在回复故障工单时,绝对禁止回复“工程割接”等文字信息。现阶段省公司对代维公司考核项目:网元区县信息完整性,一线人员接单平均历时(平均历时 30分钟),一线人员接单率(100%,微网格后网格的工单只能由所属自己网格的人员帐号接单),工单回复合格率99%(故障原因回复逻辑一致等)(一般情况下不得申请核减)5月30日前要求每一位一线维护人员必须熟练操作手机工单,接单后,根据真实处理故障的情况,按要求回复工单,并保持接单、处
4、理、回单人一致。重点注意事项工单流程规范性工单质检规范 帐号规则:(1)所有处理EOMS工单的代维人员名称前面加“代维公司简称”前缀、例如:汇源张三、超讯李四等。(2)所有处理EOMS工单的代维人员帐号应归属实际代维公司所属部门下面,不能归属在移动公司的组织树图下面。(3)每个维护人员对应一个EOMS帐号和手机号码,不允许多个账号共用一个手机或一个账号使用多个手机号码,若出现此类情况,工单将记为不合格。(请一线维护人员在回单的时候注意不要随意添加或更改电话号码,特别是不能填写其他维护人员的电话号码;如有变更,必须通过快文向账号管理员申请变更)若账号一旦被锁定,请联系维护人员电话:1398094
5、0114;工单流程合格率=质检合格的工单总数/质检的工单总数*100%。质检标准包括工单回复逻辑性、账号规范性、流程规范性(故障工单由一线接单、处理、回复,不使用调度人员)、工单处理及时性。一季度指标门限为:挑战值99%,基准值90%,已达到一季度挑战值;二季度指标门限为:挑战值99%,基准值90%。高于挑战值得满分,低于基准值得0分,介于之间线性得分。接单回单规则与注意事项(1)所有工单由一线人员直接接单、处理,不能集中接单,一人接多个专业角色或多个区县的工单视为集中调度,(即若为武侯区无线维护人员,就不能处理武侯区传输专业工单或青羊区无线专业工单),一旦此类情况发生,此人处理的所有工单记为
6、不合格;接单回单规则:(2)平均接单历时不能超过30分钟,同一微网格账号不能只用一个账号接回工单;回复工单时间必须早于工单完成时限,否则视作工单超时,记为工单不合格;(3)工单回复原因及处理过程与派单的实际故障必须符合逻辑且原因真实,如:故障原因与处理过程逻辑上必须一致;回单时,必须有故障消除时间方能回单。在结果里面是无需解决,那么在描述里面就应该是 自动恢复之类的,而不是XX故障经维护后恢复;如果在结果里面是已解决,那么在描述里面就应该是XX故障经处理后恢复,不要出现无需解决的字眼;在结果里面是延期,那么在描述里面就不该是已恢复的字眼;(4)工单回复时,保持接单人、处理人、回单人一致,否则记
7、为工单不合格。(回单时请自行检查,故障处理人及联系电话处必须与接单人、接单电话一样。目录工单流程规范性手机网管操作常见告警分析手机网管操作建议使用手机apk版本首先需要下载手机大厅,下载地址:http:/218.205.232.82/appServerApi/downloadAction.action然后在用EOMS账号登陆应用大厅系统,在排行类别中选择手机工单进行下载。手机web版本Web版本通过手机浏览器进行访问(http:/218.205.232.82/FaultOrder/index.html),浏览器建议使用Google浏览器,或者QQ手机浏览器,如果没有google浏览器建议在ap
8、p应用中下载。Google浏览器下载地址(android版本地址):http:/ phone或者iphone手机 可以直接采用手机自带浏览器进行访问比如windows的浏览器是IE,iphone的浏览器是Safari。安装手机网管程序使用介绍Add Your Title 手机工单首先使用手机工单接单,点进工单流水号可查看该故障所有告警;重点认真阅读告警描述(网元告警详情包括插框号、槽位号、具体问题等),将工单信息页面下拉,部分工单会有故障预处理情况,维护人员可根据建议进行故障的后续处理。若故障处理完成,故障工单会出现故障清除时间,届时就可根据处理实际情况,填写工单并回复。告警查询维护人员可随时
9、查询维护区域的所有告警,包括活动的和已清除的告警,选择需要查询的时间段、告警级别、设备类型、区域;处理完故障工单里的故障后,若工单没有显示清除时间,也可以通过告警查询确定告警是否已清除,清除了便可以填写清除时间进行回单操作。对于查询到的还未派发故障工单的告警,可优先处理。告警预处理告警预处理功能,可选择具体某个BSC,输入相关命令(现在提供的手机命令有查看BSC归属、licence和全部参数等);或选择BTS下某个基站,华为设备可选择查询基站情况或者进行基站复位的操作,诺西基站仅提供基站复位的操作。故障配合若故障处理情况较为复杂或涉及跨专业处理,可以联系省公司监控电话1008684进行故障的配
10、合,过渡阶段成都暂时由现有监控人员配合故障的处理,后期将统一由省公司配合。手机网管操作红色数字显示的是工单数量,点击进入可以查看列表信息。显示待办工单信息,红色图标 表示超时工单,表示已接工单。点击更多可查询详细信息。可以通过手机工单号查询告警信息,点击第一行的蓝色工单号进入告警列表点击操作按钮弹出操作列表信息。故障工单待办工单列表待办工单详情手机网管操作同组工单同组工单列表,只供查看信息。操作按钮,只能查看操作,不能进行处理。通知工单点击更多进入详细界面,可以点击已阅知按钮,表示已经知道这个工单信息。通知工单是针对不派发故障工单的告警,该工单只是为了让地市知晓告警,不纳入考核。手机网管操作工
11、单驳回工单移交点击选择移交对象按钮弹出,选择需要移交的对象。进入驳回界面,点提交即可。工单移交点击 按钮获取当前时间,如果要修改时间点击时间值 即可手机网管操作确认受理历史流转点进历史流转信息可以查看工单的派发转派流程。点击确认受理,进入工单操作界面,带红色*号的为必填信息,实际接单时不用填或更改任何信息,默认界面提交即可。追加告警点击列表就会弹出恢复时间文本信息,点击 就会把告警恢复时间填上,点击 就会取消手机网管操作工单阶段回复工单处理完成若故障在规定时间内无法处理恢复,可做阶段回复。但即使做了阶段回复,超时仍然要被考核。选择故障原因一级细分,会弹出对话框供用户选择,如果不选择下面的选项都
12、填写不了,故障原因一级细分、故障原因二级细分、故障原因、故障处理过程都是级联关系,从上往下进行选择。目录工单流程规范性手机网管操作常见告警分析常见告警分析传输线路专业专业工单主题关键字关联告警名称告警产生原因分析 常见工单回复疑难问题咨询方式传输线路ETH_LOS以太网端口连接丢失告警1:以太网端口的电缆或光纤没有连接好;2:电缆或光纤故障;3:本端网元接收光功率过低;4:单板故障。1、人为破坏光缆 故障原因一级细分 线路故障 故障原因二级细分 人为原因导致(刀割、挖断、施工、.故障原因 人为破坏光缆 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)2.施工破坏 故障原因一级细分
13、 线路故障 故障原因二级细分 人为原因导致(刀割、挖断、施工、.故障原因 施工挖断 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)3.鼠害 故障原因一级细分 线路故障 故障原因二级细分 外部自然原因导致(风、雷、雪、洪水.故障原因 老鼠咬断 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)4.自然灾害 故障原因一级细分 线路故障 故障原因二级细分 外部自然原因导致(风、雷、雪、洪水.故障原因 地质灾害引起(根据实际情况选择)故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)5.车辆挂断 故障原因一级细分 线路故障 故障原因二级细分 人为原因导致(刀割、
14、挖断、施工、.故障原因 车辆挂断 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)传输值班或华为技术支撑(69280006)MUT_LOS合路信号丢失告警。即当单板的输入合路光信号丢失时,产生此告警1:上报告警的单板有接收光口光纤连接错误或未连接或损坏;2:信号在线路传输中损耗过大;3:上报此告警的单板故障1、人为破坏光缆 故障原因一级细分 线路故障 故障原因二级细分 人为原因导致(刀割、挖断、施工、.故障原因 人为破坏光缆 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)2.施工破坏 故障原因一级细分 线路故障 故障原因二级细分 人为原因导致(刀割、挖断、施工、.
15、故障原因 施工挖断 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)3.鼠害 故障原因一级细分 线路故障 故障原因二级细分 外部自然原因导致(风、雷、雪、洪水.故障原因 老鼠咬断 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)4.自然灾害 故障原因一级细分 线路故障 故障原因二级细分 外部自然原因导致(风、雷、雪、洪水.故障原因 地质灾害引起(根据实际情况选择)故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)5.车辆挂断 故障原因一级细分 线路故障 故障原因二级细分 人为原因导致(刀割、挖断、施工、.故障原因 车辆挂断 故障处理过程 重新熔纤后恢复或
16、者跳纤后恢复(根据实际情况选择)IN_PWR_ABN输入光功率异常1:对端网元发送光功率不正常;2:接收光功率高于正常范围;3:接收光功率低于正常范围;4:接收单板故障。1.尾纤故障 故障原因一级细分 连接件故障 故障原因二级细分 尾纤 故障原因 尾纤故障 故障处理过程 跟换尾纤后恢复2.光缆性能劣化 故障原因一级细分 线路故障 故障原因二级细分 光路性能劣化 故障原因 性能劣化 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)常见告警分析传输线路专业专业工单主题关键字关联告警名称告警产生原因分析 常见工单回复疑难问题咨询方式传输线路R_LOS接收线路侧信号丢失1:对端站发送部分
17、故障;2:本站接收部分故障;3:线路性能劣化1、人为破坏光缆 故障原因一级细分 线路故障 故障原因二级细分 人为原因导致(刀割、挖断、施工、.故障原因 人为破坏光缆 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)2.施工破坏 故障原因一级细分 线路故障 故障原因二级细分 人为原因导致(刀割、挖断、施工、.故障原因 施工挖断 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)3.鼠害 故障原因一级细分 线路故障 故障原因二级细分 外部自然原因导致(风、雷、雪、洪水.故障原因 老鼠咬断 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)4.自然灾害 故障原因
18、一级细分 线路故障 故障原因二级细分 外部自然原因导致(风、雷、雪、洪水.故障原因 地质灾害引起(根据实际情况选择)故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)5.车辆挂断 故障原因一级细分 线路故障 故障原因二级细分 人为原因导致(刀割、挖断、施工、.故障原因 车辆挂断 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)传输值班或华为技术支撑(69280006)MS_RDI复用段远端接收失效指示本站检测到对端站的回告信息,指示复用段远端接收失效1.纤芯自然断 故障原因一级细分 线路故障 故障原因二级细分 外部自然原因导致(风、雷、雪、洪水.故障原因 自然断芯 故
19、障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)ETH_LINK_DOWN以太网连接错误,端口协商失败1:本端网元和对端网元的端口工作模式不一致,造成协商失败;2:端口内环回;3:纤缆连接到错误的端口;4:单板故障。1.纤芯自然断 故障原因一级细分 线路故障 故障原因二级细分 外部自然原因导致(风、雷、雪、洪水.故障原因 自然断芯 故障处理过程 重新熔纤后恢复或者跳纤后恢复(根据实际情况选择)B2_SD线路接收的信号中复用段B2信号劣化指示1:环境温度过高。2:光功率不正常;3:光纤连接器松动或未插好;4:光纤头表面不清洁;5:单板故障。1光纤连接器松动 故障原因一级细分 连接件故
20、障 故障原因二级细分 其他 故障原因 需手动写明(光纤连接器松动)故障处理过程 需手动写明(维护人员紧固连接头后,基站恢复正常,告警清除)2.光纤头清洁后恢复 故障原因一级细分 连接件故障 故障原因二级细分 其他 故障原因 需手动写明(尾纤不清洁)故障处理过程 需手动写明(清洗尾纤后恢复,告警消除)常见告警分析传输设备专业专业工单主题关键字关联告警名称告警产生原因分析 常见工单回复疑难问题咨询方式传输设备HARD_BAD硬件故障告警1:外接电源失效;2:单板与母板未良好接触;3:单板硬件故障;4:若接口板上报HARD_BAD告警,可能是对应的处理板出现故障。1.现场复位后恢复 故障原因一级细分
21、 设备故障 故障原因二级细分 其他 故障原因 单板掉死 故障处理过程 采取措施时间:xxxx-xx-xx xx:xx;故障解决情况:维护人员上站复位后恢复,告警消除,故障处理结果:已解决。2.板件更换后恢复 故障原因一级细分 设备故障 故障原因二级细分 单板故障 故障原因 板卡损坏故障处理过程 对单板/模块更换后恢复 传输值班或华为技术支撑(69280006)HSC_UNAVAIL主备倒换功能失效告警1:备用交叉板硬复位不到5分钟;2:主备交叉板版本不一致;3:单板主机软件版本和硬件版本不一致;4:交叉板坏:5业务板坏;6:子架背板坏。1.现场复位后恢复 故障原因一级细分 设备故障 故障原因二
22、级细分 其他 故障原因 单板掉死 故障处理过程 采取措施时间:xxxx-xx-xx xx:xx;故障解决情况:维护人员上站复位后恢复,告警消除,故障处理结果:已解决。2.板件更换后恢复 故障原因一级细分 设备故障 故障原因二级细分 单板故障 故障原因 板卡损坏故障处理过程 对单板/模块更换后恢复 BD_STATUS物理单板离线告警1:单板正在硬复位;2:单板未插上,或单板插上,但与母板接触不良;3:板间通讯故障。1.现场复位后恢复 故障原因一级细分 设备故障 故障原因二级细分 其他 故障原因 单板掉死 故障处理过程 采取措施时间:xxxx-xx-xx xx:xx;故障解决情况:维护人员上站复位
23、后恢复,告警消除,故障处理结果:已解决。2.板件更换后恢复 故障原因一级细分 设备故障 故障原因二级细分 单板故障 故障原因 板卡损坏故障处理过程 对单板/模块更换后恢复 COMMUN_FAIL单板间通信失效告警单板排查原因1:单板处于硬复位状态;单板排查原因2:单板故障;主控板排查原因1:38M系统时钟故障;主控板排查原因2:电源板故障,造成主控板3.3V电压异常;主控板排查原因3:主控板不在位或故障;主控板排查原因4:主控板的EXT接口直接连接HUB或者交换机。1.现场复位后恢复 故障原因一级细分 设备故障 故障原因二级细分 其他 故障原因 单板掉死 故障处理过程 采取措施时间:xxxx-
24、xx-xx xx:xx;故障解决情况:维护人员上站复位后恢复,告警消除,故障处理结果:已解决。2.板件更换后恢复 故障原因一级细分 设备故障 故障原因二级细分 单板故障 故障原因 板卡损坏故障处理过程 对单板/模块更换后恢复 常见告警分析传输设备专业专业工单主题关键字关联告警名称告警产生原因分析常见工单回复疑难问题咨询方式传输设备HARD_ERR硬件故障告警1:外接电源不正常;2:单板部分功能失效,例如时钟芯片,自检功能等。1.现场复位后恢复 故障原因一级细分 设备故障 故障原因二级细分 其他 故障原因 单板掉死 故障处理过程 采取措施时间:xxxx-xx-xx xx:xx;故障解决情况:维护
25、人员上站复位后恢复,告警消除,故障处理结果:已解决。2.板件更换后恢复 故障原因一级细分 设备故障 故障原因二级细分 单板故障 故障原因 板卡损坏故障处理过程 对单板/模块更换后恢复 传输设备ALM_GFP_DlfdGFP失步1:业务两端VCTRUNK配置的通道数量或时隙不同;2:链路误码或失效。1客户侧故障 故障原因一级细分 网管故障 故障原因二级细分 其他 故障原因 未用端口 故障处理过程 采取措施时间:xxxx-xx-xx xx:xx;故障解决情况:维护人员远程处理后,告警已恢复;故障处理结果:已解决。CLK_NO_TRACE_MODE时钟进入非跟踪工作模式1:未启动SSM协议;2:没有
26、配置系统时钟源优先级表,网元使用自带的默认优先级表;3:时钟源优先级表中除了内部源以外的其他时钟源存在状态丢失,无法跟踪;4:时钟源优先级表中除了内部源以外的其他时钟源频偏过大,无法跟踪。1.设备重启后恢复 故障原因一级细分 设备故障 故障原因二级细分 设备吊死 故障原因 设备吊死 故障处理过程 重启设备后恢复OLP_PS光线路保护倒换告警1:用户下发外部倒换命令,例如:强制倒换、人工倒换等。使得光线路保护组当前通道由工作通道切换到保护通道,会上报此告警;2:光线路保护组工作通道接收光功率异常,当前通道自动切换到保护通道;3:工作通道和保护通道光功率差异越限。常见告警分析无线专业专业工单主题关
27、键字故障原因一级细分故障原因二级细分故障原因处理过程无线 上报基站断站告警(无线自身故障)(三网跨专业)停电供电局停电/自然灾害市电停电来电恢复/油机发电恢复根据故障实际情况 下拉选择上报衍生告警BCCH MISSING 闪断告警根据实际情况根据故障实际情况 下拉选择上报 小区退服 告警根据实际情况根据故障实际情况 下拉选择上报NodeB退服告警告警(可能动环原因)(三网跨专业)根据实际情况根据故障实际情况 下拉选择动环 基站退服(动环停电问题)(三网跨专业)动环原因停电市电停电来电后恢复或油机发电后恢复电池组总电压过低告警告警动环原因停电市电停电来电后恢复或油机发电后恢复根据故障实际情况 下
28、拉选择一级低压脱离断开告警告警动环原因停电市电停电来电后恢复或油机发电后恢复根据故障实际情况 下拉选择上报输出电压过低告警告警动环原因停电市电停电来电后恢复或油机发电后恢复根据故障实际情况 下拉选择上报水浸或烟感告警告警动环原因环境类空调漏水/烟雾感应器故障检修后恢复/更换后恢复根据故障实际情况 下拉选择上报市电节点站停电告警告警动环原因停电市电停电来电后恢复或油机发电后恢复上报直流欠压告警告警动环原因停电市电停电来电后恢复或油机发电后恢复根据故障实际情况 下拉选择衍生通信状态异常告警告警根据故障实际情况 下拉选择传输基站退服(传输问题)(三网跨专业)根据故障实际情况 下拉选择上报LOS告警(
29、动环问题)(两网跨专业)根据故障实际情况 下拉选择上报 TEMP_OVER 告警设备故障风扇故障根据故障实际情况 下拉选择 上报 POWER_ABNORMAL 告警根据故障实际情况 下拉选择常见告警分析全业务专业专业工单主题关键字关联告警名称告警产生愿意分析常见处理回复方式疑难问题咨询方式(如遇相关专业问题无法解决时,该找哪个人)集团专线上报TU_AIS告警TU_AIS告警市电停电1机房市电停电,2市电来电后恢复政企网管支撑室(69280000)集团专线上报ETH_LOS告警ETH_LOS告警用户侧停电 1.设备掉电 2.用户侧停电3.恢复供电后恢复 政企网管支撑室(69280000)集团专线
30、上报T_ALOS告警T_ALOS告警单板故障1.传输设备故障,2单板故障,2更换故障单板后恢复政企网管支撑室(69280000)集团专线上报R_LOS告警R_LOS告警用户侧停电1设备掉电 2.用户侧停电,3.恢复供电后恢复 政企网管支撑室(69280000)校园WLAN上报AP下线告警wlan告警(AP下线告警,故障AP1个)AP故障1.硬件故障 2.AP假死3.重启后恢复 监控支撑室(13981951860)校园WLAN上报 AC ping不可达 告警上报 AC ping不可达 告警闪断1.其它 2.传输闪断3.闪断引起的告警,经网管中心核实,告警自动消除监控支撑室(13981951860)校园WLAN上报AP下线告警wlan告警(AP下线告警,故障AP1个)AP故障1.设备故障2.设备吊死3.重启设备后恢复 监控支撑室(13981951860)注:下拉选项中只有日常较常见故障处理分类,如实际情况在选项中无的在故障一级细分里选其它,二级细分里也选其它,在下面出现的两个大框故障原因及故障处理过程内自行回复真实原因及处理情况。