1、一. 应急预案为加强平台的安全管理,形成科学有效、反应迅速的处置机制,提高网络与 信息安全事件的应急处置能力,最大限度地保障系统的设备安全、数据安全和运 行安全,根据中华人民共和国突发事件应对法、公安部关于信息安全等级 保护工作的实施意见等有关法律法规和规定要求,结合平台运营维护实际,制 定本预案。1.1.1. 工作原则统一指挥、密切协同、快速反应、科学处置。在应急小组的统一领导下,各 机构合理分工,相互协作,形成快速、稳妥地处置 突发事件的工作机制。预防与处置相结合,以预防为主。加强风险排查,减少故障隐患,做好应急 处置的各项准备,严格执行 运行制度,确保故障及早发现。果断处置、有效应对。
2、发生突发事件时,要按应急处置流程及时报告,快 速启动应急预案进行应急处置,最大程度减少突发事件造成的危害和影响。及时报告,联络畅通。明确突发事件报告路线和报告渠道,一旦发生突发事 件或出现潜在的危机事件,要保证能及时通知到相关应急处置机构。1.1.2. 应急组织与职责1.1.2.1. 平台应急小组服务期间,由客户牵头成立平台应急小组,成员包括软件开发单位、硬件集 成单位和项目监理单位。平台应急小组负责试运行期间突发事件应急处理工作, 由平台应急小组认定系统应急处理工作的重大事项,如发布 系统运行应急指令、 突发事件故障级别、决策处理方案;其他小组成员负责组织实施、业务协调等。平台应急小组结构图
3、如下:1.1.2.2. 其他部门相关部门负责配合处置各类突发事件。1.1.3. 事件级别在服务期间,服务单位对在平台运行过程中发生的网路故障、系统宕机、平 台出错、软件崩溃、数据遗失、操作失误等方面的突发事件制定相应的应急预案。突发事件分为:一般故障、重大故障、特大故障三类。 一般故障:指系统出现轻微错误或瑕疵,具体包括:个别图片无法显示、个 别信息内容出现明显错误、个别服务或功能无法正常使用等。重大故障:指系统出现异常,但不影响系统日常使用,具体包括:局部页面 错误、部分功能无法使用,部分信息内容出现明显错误等。特大故障:指系统崩溃,应用服务停止,导致大规模用户无法使用系统,出 现数据丢失,
4、具体包括:系统服务无法启动、数据库无法连接、系统程序异常和 数据库文件损坏等。附表:突发事件分类表突发事件类型突发事件内容一般故障个别图片无法显示;个别信息内容出现明显错误;个别服务或功能无法正常使用等;重大故障局部页面错误;部分功能无法使用;部分信息内容出现明显错误等。特大故障系统服务无法启动;数据库无法连接;系统程序异常或数据库文件损坏等。1.1.4. 预防预警1.1.4.1. 平台信息监测坚持以预防为主的方针,不断加强网络与信息安全监测,及时收集、分析、 研判监测信息,主动发现网络与信息安全事件倾向或苗头,及早采取有效措施加 以防范,使各种安全隐患消除在萌芽状态。以平台作为监控重点,由服
5、务单位提 供技术支撑,尽早发现问题,解决问题。1.1.4.2. 平台线路保障提供互联网接入和内部光纤网络接入的网络运营商必须保证负责其线路的 正常、稳定运行。若运营商方有线路维护或设备变更,一定程度影响平台正常运 行,要求及时协调,必须提前 2小时通知平台的负责领导,然后由领导通知各相 关单位,早作预备。1.1.4.3. 平台集中管理平台集中管理,可托管到核心机房或使用云服务商提供的虚拟主机服务,以 充分利用和共享平台的安全技术资源以及信息网络资源。1.1.4.4. 预警发布处理对平台信息监测中发现可能发生网络与信息安全事件的,发现部门要及时发 出预警信息,在2 小时内报平台分馆领导,并在 4
6、 小时内向上级领导报告。1.1.4.5. 事件报告当网络与信息安全事件发生时,事发单位要将情况及时报告。初次报告时间 最迟不得超过事件发生后 2 个小时,报告内容主要包括事件特征、事件性质、影 响范围、事件趋势和拟采取措施等。1.1.5. 突发事件应急预案1.1.5.1. 事件通报流程当发生技术故障,可能导致或已经造成业务处理中断时,突发事件通报流程 如下:1应急小组运维人员及时通知服务单位和各部门,并指定一名或两名运维 人员作为本次故障联络人。故障联络人负责接听同级和下级单位上报、咨询电话, 负责与平台应急小组沟通联系,通报故障问题及处理进度情况。报告内容:事发机构名称、时间、地点,故障现象
7、简要描述,可能影响的业 务范围及事态发展趋势,已采取或拟采取的应对措施,故障恢复的大致预期等内 容。2平台应急小组成员接到故障通报后,及时向服务单位技术部负责人报告, 并负责通知各部门,配合排查故障及相关恢复工作。3平台应急小组要及时保持与各服务单位的联系。4恢复正常运行后,平台应急小组向各相关机构发送通知,告知系统恢复 正常运行,可进行业务操作。1.1.5.2. 事件处置流程当发生软、硬件技术故障,可能导致或已经造成业务处理中断时,事件分级 处置流程如下:一般故障1 应急小组负责人接到突发事件报告后,应立即组织平台应急小组相关人 员对故障进行评估,确定事件等级并启动一般故障应急预案。2. 应
8、急小组负责人通知软件开发单位或硬件集成单位进行故障原因排查, 并在 1 小时内完成故障处置。3应急小组填写故障登记表。故障恢复后填写故障处置方案审批表 (见附件 2),由应急小组负责人签字后归档,作为备案依据。4软件开发单位、硬件集成单位接到故障通知后按照应急预案处置判定级 别完成故障恢复工作。5平台应急小组组织软件开发单位、硬件集成单位对突发事件进行评估, 对系统进行全面的检测并排查其他可能的故障隐患。6.故障处置并恢复完成后,由平台应急小组向上级领导部门,服务单位发出 故障解除通知。1.1.5.3. 后续处置突发事件应急处置结束后,平台应急小组分析突发事件的原因,对于一般故 障突发事件,由
9、平台应急小组在 7 个工作日内填写 应急事件总结报告,交平 台应急小组负责人签字并归档,作为备案依据;对于重大或特大故障突发事件, 在明确责任后,由责任方在 3-5 个工作日内提交 应急事件总结报告并加盖 项目专用章(或公司公章),提交平台应急小组负责人进行审核,审核通过后归 档并同时通知突发事件所涉及各部门。事件总结报告内容应包括但不限于:(一)事件概况,包括事件发生时间、地点、事件经过、事件影响范围、影 响程度、和导致的后果等。(二)应急处置过程,包括事件上报过程、采取的措施及效果。(三)事件发生的主要原因分析、事件性质、结论。暂时无法确定事件原因 的,应给出事件的初步原因,并组织力量尽快
10、查找原因,在找到事件原因后再提 交事件总结补充报告。1.1.6. 应急保障措施应急保障措施是对中断或严重影响业务的故障,如宕机、数据丢失、业务 中断等,进行快速响应和处理,在最短时间内恢复业务系统,将损失降到最 低。(1)系统运维人员要定期规范检查各硬件设备的运转情况和应用软件运行 情况,同时做好日常的数据增量备份和定期全备份。对发现的问题在报各级负 责人的同时,要协调相关资源分析问题根源,确定解决方案和临时解决措施, 避免造成更大的影响。问题得到稳定或彻底解决后,要形成问题汇报,避免以 后类似重大紧急情况的发生;(2)对发现的问题在报负责人的同时,要协调相关资源分析问题根源,确 定解决方案和临时解决措施,避免造成更大的影响。问题得到稳定或彻底解决 后,要形成问题汇报,避免以后类似重大紧急情况的发生;(3)建立常用知识库,其中包括多种常见技术故障和突发事件的应急策 略。当获悉出现突发事件时,技术支持人员可以立即从知识库中获取相应的应 急策略,并综合用户方的具体情况,给出相关解决方案,然后在第一时间以电 话、邮件支持或现场服务的方式帮助用户解决问题,尽最大努力减小突发事件 对用户日常应用的影响。