故障管理-故障处理流程介绍.ppt

上传人:本田雅阁 文档编号:2830221 上传时间:2019-05-24 格式:PPT 页数:45 大小:4.52MB
返回 下载 相关 举报
故障管理-故障处理流程介绍.ppt_第1页
第1页 / 共45页
故障管理-故障处理流程介绍.ppt_第2页
第2页 / 共45页
故障管理-故障处理流程介绍.ppt_第3页
第3页 / 共45页
故障管理-故障处理流程介绍.ppt_第4页
第4页 / 共45页
故障管理-故障处理流程介绍.ppt_第5页
第5页 / 共45页
点击查看更多>>
资源描述

《故障管理-故障处理流程介绍.ppt》由会员分享,可在线阅读,更多相关《故障管理-故障处理流程介绍.ppt(45页珍藏版)》请在三一文库上搜索。

1、故障管理-故障处理流程介绍,第2页/共12页,目录,背景、目的和重要定义 新流程 角色和重点KPI,第3页/共12页,背景和目的,背景:集中化监控体系的进一步深入,对故障管理和执行的工作要求提高。故障级别定义各异,故障处理过程中管理的辅助响应有待加强;故障处理的过程记录和分析较少,后期进入知识库的过程较少。按照集中化工作目标要求,故障派单的对象不满足集中化要求。故障处理过程中的信息化支撑手段还需进一步提高。 目的:故障管理-故障处理流程,以三级故障处理模式为基础,明确各级职责、技术要求、处理时限,达到缩短故障处理历时、提高处理及时率、快速恢复业务、保障网络正常运行的目的。该流程强调知识的共享,

2、体现以省为中心的集中化运维思路。,第4页/共12页,重要名词的定义1,故障:指移动通信网内,介入通信的主备用设备、通信网络在承担业务期间,因某种原因造成全部或部分业务中断、网络性能下降的事实或隐患。体现为设备告警、性能异常、用户投诉等现象。根据故障是否需要立即处理,分为紧急故障和非紧急故障。根据故障对网络以及通信业务的影响程度,可将故障划分为重大故障、严重故障、一般故障。 紧急故障:指对通信业务产生大规模严重影响的故障,或者虽尚未对通信业务产生大规模严重影响,但经网络维护单位及厂家共同认定必须立即处理的故障。包括重大故障、严重故障以及经维护人员与厂家共同判定为紧急故障的一般故障。非紧急故障:除

3、紧急故障之外的故障,统称非紧急故障。 重大故障:指系统处理能力显著降低、可用系统资源明显减少(主要指系统内存)、大面积用户功能丢失、计费数据产生及输出异常、路由中断等,对通信业务产生严重影响的电路、设备、通信故障。,第5页/共12页,重要名词的定义2,严重故障:指系统部分功能异常、电路质量恶化并导致通信质量下降、话务监视及测量和网络管理功能受损,尚未对通信业务产生直接的严重影响,但具有重大故障隐患,如果不尽快处理,将导致业务受阻的故障。严重故障如不及时处理将成为重大故障。 一般故障:除重大故障、严重故障以外的其它所有故障。 故障管理:对来自于设备告警、用户投诉、性能异常的现象进行诊断、处理、上

4、报的过程,实现对故障的管理。故障管理流程是管理网络故障的流程,包括三个主要业务场景,即故障处理、投诉处理、紧急故障管理。 故障管理-故障处理流程是处理来自于设备告警、性能异常、大面积用户投诉的流程。,第6页/共12页,目录,背景、目的和重要定义 新流程 角色和重点KPI,第7页/共12页,流程梳理的依据和原则,第8页/共12页,故障管理流程是集团卓越运维体系16个流程模块之一,包括三个主要业务场景,即故障处理、投诉处理、紧急故障管理。,故障管理流程,流程与卓越运维体系的关系,第9页/共12页,流程之间的关系,故障处理流程,故障管理流程,创建故障单 故障单,卓越运维体系,变更管理,告警监控,作业

5、计划,故障单,故障单,结束故障单,紧急故障管理流程,投诉处理流程,变更请求,大面积投诉故障单,故障单处理结果,紧急故障,故障处理流程是中国移动流程体系架构中“运行维护模块”的一部分。故障处理流程与告警监控流程、作业计划-作业计划执行流程、集团层面故障处理流程、故障管理-紧急故障管理流程、变更管理流程-软件变更、变更管理流程-网络数据管理、变更管理流程-网络综合调整、投诉处理流程具有交互接口关系。,第10页/共12页,子流程之间的关系,故障管理流程是管理网络故障的流程,包括三个主要业务场景,即故障处理、投诉处理、紧急故障管理。 对于属于紧急类型的故障,在调用本流程进行故障处理的同时,启动紧急故障

6、管理流程辅以支持,促进紧急故障的快速解决和逐级的汇报,便于管理层及时掌握故障的发生、处理、解决过程。对于属于非紧急类型的故障,直接调用本流程进行处理。,第11页/共12页,故障管理-故障处理流程,故障工单建立,故障管理-故障处理流程:以现有集中化工作要求为基础,对来自于设备告警、用户投诉、性能异常的现象进行诊断、处理、上报的过程,实现对故障的管理。,一级响应故障要辅 助管理流,故障解决后 更新变更记录; 提交最终解决方案,协调总部解决本省故障,第12页/共12页,告警监控与故障处理的关系,网管告警关联后派单(自动化、半自动化、手工),一级响应,二级响应,故障处理工单、紧急故障管理工单,故障处理

7、工单,不同级别响应的故障,对于故障的处理活动相同; 处理过程中管理和关注程度不同。,雏形为重大故障上报工单,重点添加管理层通报、启动应急预案、后期重大故障的判断和上报等。,第13页/共12页,详细的故障处理流程,第14页/共12页,简易的故障处理 流程图,第15页/共12页,双击打开该对象 (非最大化演示状态),故障处理 分级,第16页/共12页,故障处理流程关键点1,流程适用的业务包括:监控发现的故障、用户投诉的故障、作业计划执行中检测发现的故障等。 在受理故障工单的初期,将依据故障的紧急程度进行分类。对于属于紧急类型的故障,在调用本流程进行故障处理的同时,启动紧急故障管理流程辅以支持,促进

8、紧急故障的快速解决和逐级的汇报,便于管理层及时掌握故障的发生、处理、解决过程。对于属于非紧急类型的故障,直接调用本流程进行处理。 按照故障分级处理的原则,将故障处理过程分为简单处理、专业处理、技术支援处理三阶段。简单处理阶段也称作故障预处理或故障一级处理阶段(T1),通常指借助网管手段进行远程故障处理,一般由发现故障的第一责任人(监控组)负责。随着自动化水平的提高,部分故障的预处理过程可以由网管支撑系统自动实现。专业处理阶段指故障由专业维护部门处理的阶段,也称作故障二级处理阶段(T2),通常指需要较强的专业知识或需要专业维护人员到设备现场进行处理的故障。代维处理也属于二级处理。专业维护部门不能

9、处理的故障升级到技术支援(T3)处理,需要厂家配合处理时由技术支援处理阶段统一提交厂家。,第17页/共12页,故障处理流程关键点2,故障处理以“快速恢复业务”为首要原则,在故障无法立即排除的情况下,启动应急预案,恢复用户业务;若无预案,则现场制定调度方案,恢复业务。此方案的启动将不需通过变更管理审核,待实施完成,需将本次配置修改情况和最终解决方案的申请一同提交变更管理。 故障处理完成后需填写处理结果,提交“报结申请”。故障处理结果分为“已解决”、“延期解决”、“无需解决”三种。故障已解决,则标注为“已解决”;对于未解决的故障,判断是否为延期解决,延期解决指已有解决方案,但短期内因客观条件限制尚

10、无法解决的故障,如需要厂家软件升级、备件不足正在送厂家维修等情况。申请延期解决,审批人为领导,工单申请延期后,在领导未审批前,工单处于“等待审批”状态,不能继续走故障处理流程,要等领导审批了才能往下走。如果领导同意延期,则审批过程时间不纳入工单处理时间,如果不同意,审批过程时间纳入处理时间(领导在工单超时后审批,则该工单仍计入超时工单)。 对于非延期解决的未解决故障,该故障可能为误告警或其它原因不需要解决,则将工单状态标注为“无需解决”。,第18页/共12页,故障处理流程关键点3,手工创单时,工单的确认人是工单创建人,网管系统派单时,工单的确认人是故障处理工单的第一个签收人。 T1移交到T2,

11、只能是一对一,同级内的移交也只能是一对一,只能对工 单进行移交,不能对任务进行移交。 当无法确定故障与本专业无关时,不能将故障责任主体进行转移,即不能进行同级移交,可以进行分派。 T3是技术支援处理阶段,目前的技术支援流程因为集团运维处与集团技术支援处的标准和要求不一致,直接在T3流程里无法满足技术支援流程的要求,因此对于不需要到厂家的技术支援单,需要在省内技术支援流程上重新生成一个工单,最后将专家提供的最终回复结果在T3回复;对于需要到厂家的工单,如果集团有要求的,则在集团的EOMS上进行派单到厂家,最后将厂家回复的结果在T3回复里回复,如果集团没有要求的,可以参考专家的处理方式进行处理。,

12、第19页/共12页,新故障处理流程几个重要概念,派发:工单建单人将工单派发给处理人,处理人处理完后回复给派发人员。(工单的建单人随着自动化程度提高,可以是机器。) 分派:工单处理人员将工单分派给其他人员处理,工单责任主体不变,仍是分派人,其他人员处理完后回复给分派人员。(分派只能在同级内部完成,省市公司可以根据需要和划分标准设置成同级,以便实现工单处理人员的任务分派。如:可以将市监控设置成与省监控同一级,都为T1,则省监控工单处理人员在工单受理后,可以将工单分派给市监控处理。) 移交:工单处理人员将工单移交给其他人员处理,移交后工单责任主体转移给被移交人,被移交人处理完后回复给移交人员的上级人

13、员。 1)同级移交:同一级别内,进行工单责任主体的转移(如T2和T3内部)。 2)升级移交:不同级别内,进行工单责任主体的转移(如T1和T2、T2和T3)。,分派,移交,第20页/共12页,新旧故障处理流程最大区别,新流程推行的是“大闭环”理念:即工单从监控分派或者移交后,下一个处理者若发现该故障完全不属于本专业处理,应该是其他专业处理,则该处理者不能将该单退回给监控再派,而是直接移交到下一个处理者;如果不能完全确定本专业没有问题,则只能用分派的功能,将任务分派给其他相关的专业室处理,即该处理者就承担的主处理室的功能。 新流程只有故障管理员有对工单质量是否符合要求的退单权利,减少了工单的频繁“

14、踢皮球”情况,只有故障管理员可以对工单的处理质量和告警是否消除进行判断后退单。 新的流程考虑比较充分,将原来旧流程里一直无法解决的等待硬件、等待补丁等导致工单超时的工单给予了更明确的处理,同时考虑到随着自动化程度提高,工程等部分不需要处理的告警信息也存在派单情况,增加了“工单延期解决”和“工单无需解决”2种状态。,第21页/共12页,新紧急故障管理流程(详细图),第22页/共12页,新紧急故障管理流程(简易图),第23页/共12页,核心网故障处理环节,角色:故障建单人,角色:故障一级处理组,角色:专业维护组,角色:技术支援组,角色:故障建单人,省网维监控室,省网维监控室,省网维各专业室维护组,

15、省网维各专业技术支援专家组,省网维监控室,角色:故障处理主管,市网维专业室故障处理主管,角色:运营商协调员,市网维运营商协调员,市网维综合维护组,市网维专业维护组,第24页/共12页,BSC故障处理环节,角色:故障建单人,角色:故障一级处理组,角色:专业维护组,角色:技术支援组,角色:故障建单人,省网维监控室,省网维监控室,省网维各专业技术支援专家组,省网维监控室,角色:故障处理主管,市网维专业室故障处理主管,市网维综合维护组,市网维专业维护组,第25页/共12页,目录,背景、目的和重要定义 新流程 角色和重点KPI,第26页/共12页,角色标准化设计的目标,通过对运维岗位角色的梳理和标准化,

16、理清现有网络部门的职能交叉和缺失,保证各项核心运维任务依照标准化流程高效地开展和落实,从而提高运维管理的效率。 确保每个流程的每个应用场景都事先有确定的岗位角色来承担相应的职能,避免职能交叉或缺失; 流程实施不一定要进行组织调整,但通过流程角色的设计,可以帮助省公司发现部门职能是否存在交叉,从而优化组织,逐步建立与流程相适应的组织。即标准化的角色方案并不强求统一的组织架构模式,但是,职能的合理归口有利于流程的顺畅。,第27页/共12页,角色标准化设计的原则,以核心流程中的标准化角色为基础,根据流程实际应用的范围,将标准化流程角色以业务类型、设备类型、设备厂家、所在地域等属性进一步细分。设计原则

17、是将标准化角色划分到最小颗粒,以确保每个流程的应用场景均有相应的流程角色承担相应的职能活动。 最小颗粒:一个实际的工作岗位(或人员)可能承担一个或者多个流程角色的职责。例如, 标准化角色“新业务接口人”可以细分为“话音类新业务接口人”、“数据类新业务接口人”、“集团客户类新业务接口人”等多个流程角色,细分后的多个流程角色有可能是一个人承担,也可能是多人承担,这取决于角色的工作量以及人员的工作能力和经验。因此,在角色设计时,就必须将标准化角色细分到最小颗粒,使得流程角色能够明确的对应到某个具体的岗位或人。 设计方案列出中国移动网络运维体系核心流程说明书(省公司)中核心运维流程的全部细分角色,但这

18、些角色并不是省公司网络运维部门的全部职能角色,非核心流程的角色设置并不包含在内。未来总部将组织进一步的研究,随着流程体系的不断扩展逐步完善该方案的角色覆盖范围。,第28页/共12页,角色设计方法,针对标准化流程体系中每个流程对应的角色进行分解说明,每个流程对应一个EXCEL表,在表中各个sheet中对每个角色进行分解说明,内容包括角色名称、职责说明、工作文档依据、角色划分、技能要求等。 角色名称和职责说明与流程体系说明书中一致; 工作依据文档包括该角色开展相应工作所应参照的管理制度、技术手册; 角色划分是角色设计的重点; 技能要求包括担任相关岗位年限、培训课程等,体现出各岗位角色间的关联性和进

19、阶路线。,角色设计的重点,第29页/共12页,角色设计方法,进一步细分厂家,相关岗位工作年限,第30页/共12页,角色设计方法,根据角色所属的流程特性,按照不同的角度细分角色。 在有的流程中,角色是按照业务类型划分的,例如投诉处理流程、新业务开通流程; 在有的流程中,角色是按照系统和机型划分的,例如故障处理流程、作业计划执行流程。 在业务分类方面,设计文档按照话音类业务、数据类业务、集团客户类业务等方式进行分类,省公司也可以根据情况按照其他方式分类;在专业分类方面,设计文档是按照话音网、数据网、业务平台、传送网、电源及配套设备、网管支撑系统进行分类的。省公司也可以按照核心网(再分为话音核心网、

20、数据核心网)、接入网(再分为话音接入网、数据接入网)、业务系统、传送网、电源配套、网管支撑系统等分类。这只是方法问题,可以灵活掌握。但无论采用哪种分类方法,原则是一致的,即:要将岗位角色细分到最小颗粒,各项职责不能有遗留,每个最小粒度的岗位角色要在实际工作中有人员对应。,第31页/共12页,角色设计方法,针对同一流程中不同的角色,按照不同的粗细程度划分角色。一般情况下,流程的标准化角色可以大致分为接口人、管理员、负责人和流程执行者(操作员)四类。 对于接口人、管理员和负责人,作为牵头人或审核人,角色划分相对较粗。例如,“投诉管理员”可以划分成4个角色; 对于流程执行者,作为具体操作员,角色划分

21、相对较细。例如, “投诉一级处理组”被划分成17个角色。 角色划分还要考虑未来岗位角色方案的扩展和维护思路,使得新增专业、系统、机型和业务类型时,可以纳入已有的角色框架之内。 每个细化后流程角色必须对应到某个明确的责任人员,但一个人可以担当一个或多个角色。 流程角色名称为“组”的则对应一个虚拟工作组,但牵头人是一个明确的人员。 除非由于工作量的原因、人员备份的原因,才让多个人员分担同一个角色,但各省应尽量控制一个角色对应到多个人,特别是对于实时性不强的任务,应避免一个角色对应多个人员,可以用代办的方式设置阶段性的任务委托,否则,容易引起职责不清、无法评估考核的问题。,第32页/共12页,角色设

22、计方法,流程是固化的,组织和人员调整不会影响流程,当组织和人员发生调整时,只需修改角色矩阵,3-D,第33页/共12页,故障管理-故障处理流程,共计5个标准化角色: 故障管理员 故障一级处理组 专业维护组 技术支援组 运营商协调员 故障管理员 作为接口人,按照专业、系统划分成41个角色,第34页/共12页,故障管理-故障处理流程,故障一级处理组、专业维护组、技术支援组,作为执行者,按照专业、系统、厂家进行细分,都被划分成79个角色。,第35页/共12页,故障管理-故障处理流程,运营商协调员,不划分专业,只设一个角色,第36页/共12页,第1步 角色与岗位(人员)的对应分解,第37页/共12页,

23、难点1:专业和系统的细分程度与省公司的实际情况密切相关。例如,对于告警监控员和故障管理员,上述分解方法是否已经达到最小颗粒?有的公司可能需要进一步细分,有的公司却需要合并同类项。 难点2:多个流程的角色可以由同一个人或同一组人员承担,可以提高人员配置效率。如果角色职责分属不同的部门,则无法做到这一点,但要进行组织调整会有一定难度。,第1步工作的难点,第38页/共12页,第2步 矩阵式的职责、角色关系视图,依托岗位角色设计方案梳理实际工作岗位设置,查找缺失或者重复,并最终制作出省公司部门及员工的岗位视图。,部门职责 考核指标,部门领导,工作职责及要求 参照执行的流程 工作文档的模板 所需的知识和

24、能力,员工,部门视图,员工视图,第39页/共12页,第2步工作的难点,难点1:查找和弥补职责缺失,尤其要注意多部门人员完成同一标准化角色的情况。例如,有的省公司,网管中心、数据中心等生产中心都会有故障管理员的角色。 难点2:查找和避免职责交叉重复,尤其要注意部门间接口人员的职责是否有交叉。 因此,建议由统一的组织或工作组对所有流程的标准化角色进行岗位映射,便于发现职责缺失和交叉。,第40页/共12页,第3步 IT实现,工单样例,角色设计的IT实现,第41页/共12页,故障管理-故障处理流程角色表,第42页/共12页,故障管理-故障处理流程角色表,详见故障处理流程角色表,第43页/共12页,流程KPI设置,第44页/共12页,流程KPI设置,第45页/共12页,谢 谢!,感谢您的聆听 敬请您的指导,

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1