中国联通私有云运维管理技术规范v20130830-1剖析.pdf

上传人:白大夫 文档编号:5407324 上传时间:2020-05-02 格式:PDF 页数:128 大小:1.99MB
返回 下载 相关 举报
中国联通私有云运维管理技术规范v20130830-1剖析.pdf_第1页
第1页 / 共128页
中国联通私有云运维管理技术规范v20130830-1剖析.pdf_第2页
第2页 / 共128页
中国联通私有云运维管理技术规范v20130830-1剖析.pdf_第3页
第3页 / 共128页
中国联通私有云运维管理技术规范v20130830-1剖析.pdf_第4页
第4页 / 共128页
中国联通私有云运维管理技术规范v20130830-1剖析.pdf_第5页
第5页 / 共128页
点击查看更多>>
资源描述

《中国联通私有云运维管理技术规范v20130830-1剖析.pdf》由会员分享,可在线阅读,更多相关《中国联通私有云运维管理技术规范v20130830-1剖析.pdf(128页珍藏版)》请在三一文库上搜索。

1、中国联通公司企业标准 QB/CU XXX-2013 中国联通私有云运维管理技术规范 China Unicom Private Cloud Computing Operations Management Technical Specification (V2.0 ) 2013-XX-XX 发布2013-XX-XX 实施 中国联通公司发 布 中国联通私有云运维管理技术规范V2.0 II 目录 目录 . II 前言 IV 中国联通私有云运维管理技术规范V2.0 1 1 范围 . 1 2 规范性引述文件. 1 3 缩略语和术语. 1 3.1 缩略语 . 1 3.2 术语及定义 1 4 私有云运维管理体

2、系框架. 2 4.1 私有云运维管理的概述. 2 4.2 体系框架定位. 4 4.3 体系架构管控策略. 4 4.4 体系框架总图. 4 4.5 体系框架特点. 5 4.6 云运维管理与传统IT运维管理的差异 . 5 5 云运维管理要求. 6 5.1 云运维管理体系概述 6 5.2 云运维管理业务场景(需讨论业务场景的描述方式) 6 5.3 云运维组织人员管理 13 5.4 云运维流程制度管理(需讨论对每个流程的描述方式:流程定义、流程图、流程说明?流程图也需统 一格式) . 18 5.5 运维活动考核指标(与5.4章节流程对应)(考核指标表格格式未统一) 51 6 云运维技术要求(需讨论数据

3、要求的格式) . 56 6.1 租户管理技术要求(亿阳). 56 6.2 云资源管理技术要求(中兴). 57 6.3 云监控技术要求(HP) . 66 6.4 服务目录管理技术要求(华胜)(服务目录具有灵活的增删改能力,需要提服务设计,通过服务设计来 新增服务目录条目,服务目录的删除也需要提资源的回收等) . 72 6.5 服务等级管理技术要求(华胜). 73 6.6 自动化部署技术要求(普元). 73 6.7 策略管理技术要求(东软). 73 中国联通私有云运维管理技术规范V2.0 III 6.8 配置管理技术要求(东软). 73 6.9 资源数据模型设计要求(VMware) . 73 6.

4、10 配置数据模型设计要求(VMware) . 81 6.11 云监控指标体系设计要求(VMware) . 82 7 云运维数据采集要求(泰岳)(参见CUS_ITSM_03_ 中国联通 IT服务管理支撑平台接口规范V1.0(送审稿) ) 96 7.1 数据采集技术要求. 错误!未定义书签。 7.2 业务数据采集接口技术要求. 96 7.3 数据采集性能要求. 97 7.4 同步接口要求. 97 7.5 与IaaS平台接口 . 105 7.6 与PaaS平台接口 117 7.7 与SaaS平台接口. 120 7.8 与云运营管理接口. 错误!未定义书签。 中国联通私有云运维管理技术规范V2.0

5、IV 前言 随着云计算技术的成熟,中国联通基于云计算的内部支撑系统建设逐步推进。基础设施、平台和终端 架构向云计算演进,一方面新建系统普遍采用云计算架构,另一方面已有系统也在向云计算平台迁移。为 了更好的指导中国联通云化后的IT 运维管理,本规范对中国联通未来云化后的IT 运维管理提出了全面要 求,用于指导中国联通未来云计算运维管理的建设,实现按需的IT 服务支撑。 本规范遵循中国联通业务需求和云计算技术堆栈相结合的原则,依据中国联通已开展云计算项目、云 计算业务发展需求和规划,同时充分调研云计算相关国际标准、行业标准、技术发展现状及竞争对手企标 进展情况,在这基础上,结合联通规划,对中国联通

6、私有云运维管理提出了全面要求,明确了私有云计算 运维管理的范围、用户、对象及体系架构,规定了中国联通私有云计算运维管理的管理要求、技术要求, 以及中国联通私有云计算运维管理的资源数据模型和监控指标体系等。随着业务需求和技术的不断发展, 本标准将不断进行补充和完善。 本规范适用于指导中国联通未来云计算运维管理的建设。中国联通在此之前的文件与本规范不一致 的,应以本次规范要求为准,并在相关的具体规范发布后废止。 本标准由中国联通公司信息化事业部提出。 本标准由中国联通公司技术部归口。 本标准主要起草单位:中国联通信息化事业部,联通研究院。 本标准主要起草人:孙海峰,张云勇,宋积慧,李卫,王智明。

7、本标准的修改和解释权属中国联合网络通信有限公司。 中国联通私有云运维管理技术规范V2.0 1 中国联通私有云运维管理技术规范V2.0 1 范围 2 规范性引述文件 3 缩略语和术语 3.1 缩略语 缩略语英文全称中文含义 API Application Programming Interface 应用程序编程接口 IaaS Infrastructure as a service 基础设施即服务 IT Information Technology 信息技术 PaaS Platform as a service 平台即服务 PRM Partner Relationship Management 合

8、作伙伴关系管理 SaaS Software as a service 软件即服务 SOA Service Oriented Architecture 面向服务的体系架构 3.2 术语及定义 术语 / 定义解释 ESB 基于开放的标准消息总线,用于通过标准的适配器和接口,来提供各程序和组件 之间的互操作功能。它支持相互独立的异构环境中的服务、消息及基于事件的交 互,并且具有适当的服务级别和可管理性。 ETL指数据抽取、转换、装载的过程。能够按照统一的规则集成并提高数据的价值,是 负责完成数据从数据源向目标数据仓库转化的过程,是实施数据仓库的重要步骤。 IaaS 以服务的形式,提供计算、存储、网络

9、等基础设施资源,用户无需购买服务器、 存储设备、网络设备,只需通过互联网租赁即可搭建自己的应用系统,帮助削 减IT基础设施的建设成本和运维成本。 PaaS 以服务的形式,提供软件开发、测试、部署和运行环境,以及能力开放接口或应用 服务引擎,屏蔽软件开发底层复杂的操作,用户可以快速开发出基于云平台的高性 能、高可扩展的服务。 SaaS 以服务的形式,提供各种在线软件,用户不必购买软件,只需按需租用软件。 SOA 一种新型的软件体系架构模式,它是在计算环境下设计、开发、应用、管理分散 中国联通私有云运维管理技术规范V2.0 2 服务单元的一种规范,它将应用程序的不同功能单元(称为服务)通过服务间定

10、义 良好的接口和契约联系起来。可以根据需求通过网络对松散耦合的粗粒度服务进 行分布式部署、组合和使用。 云监控提供对云服务的资源监控,供用户查看资源的使用情况、运行性能等,包括了CPU 的使用率、磁盘读写和网络流量情况 云计算一种新的计算方法和商业模式,通过虚拟化、分布式处理和宽带网络等技术,按照 “即插即用”的方式,将计算、存储、网络等IT基础设施,以及其上的开发平台、 软件等服务,抽象成高效、弹性、可运营、可管理的公共信息处理资源,通过公众 通信网络,以按需分配的服务形式向用户提供动态可扩展信息处理能力和应用服 务,用户按实际使用数量进行付费在云计算下,使用者通过公众通信网络,以按需 分配

11、的服务形式,获得动态可扩展信息处理能力和应用服务,也是电信运营商新的 信息服务产品和ICT交付模式, 资源出租转化为能力出租,由自建自营到开放共赢。 云平台云平台是指云运维管理所辖的IaaS/PaaS/SaaS综合管理平台, 资源池资源池是一组物理资源或一组虚拟资源的集合,可以从池中获取资源,也可将资源 回收到池中。 资源包括物理机、虚拟机、 虚拟网络设备、 物理网络设备和IP地址等。 4 私有云运维管理体系框架 4.1 私有云运维管理的概述 4.1.1 私有云运维管理的范围 根据私有云计算在运维和运营方面的特点,以及管理范畴的模糊划分,中国联通私有云运维管理的 一体化服务支撑涵盖运营管理和运

12、维管理两部分内容。 中国联通私有云运维管理一方面面向中国联通内部的云资源使用者( 租户 ) ,提供云计算服务需求受 理、开通、服务计量和客户服务等服务;另一方面面向云资源管理者和云运维工程师,提供云资源的规 划、监控、调度、分配、调拨、维护和优化建议。云运维管理的最终用户是运维管理人员及支撑人员。 本规范将聚焦于私有云运营管理及运维管理的管理要求、技术要求及接口要求。 4.1.2 私有云运维管理的用户(最终用户对象需确认) 私有云运维管理的最终用户包括中国联通内部的使用者、运维技术人员、运维管理人员及运营支撑人 员。 4.1.3 云运维管理的对象 云运维管理的对象包括IaaS 平台、 PaaS

13、平台和 SaaS平台内的所有云资源。 云资源包括IaaS 层的物理资源和虚拟资源,PaaS 层的数据库资源、中间件资源和技术服务组件资 源,以及SaaS的私有云应用和公有云应用等。 由于 IaaS/PaaS/SaaS 综合管理平台容量规模限制及管理要求,可能存在多个IaaS/PaaS/SaaS 综合管 中国联通私有云运维管理技术规范V2.0 3 理平台 4.1.4 中国联通的云运维管理体系 中国联通云运维管理体系具有如下典型的三级部署架构:( 资源池需统一画一起,传统硬件与云运维 管理之间加入IT资源管理 ) 图 4-1 云运维管理的三级部署架构 对应于云运维管理体系的部署架构,其运维支撑体系

14、也进行了三级划分,相比较传统IT 服务支撑的运 维支撑体系增加了虚拟化资源池和IaaS/PaaS/SaaS平台运维职责,同时在三线运维工程师增加了虚拟化 平台和IaaS/PaaS/SaaS平台的原厂。(传统硬件运维箭头调整到云运维处) 图4-2 云运维管理体系 运维工程师设置为一线运维工程师、二线运维工程师和三线运维工程师,职责如下: 一线运维工程师主要负责对IaaS/PaaS/SaaS资源池以及传统硬件的运维。云运维管理体系中一 线维护人员参与的流程可参照代维对象代维管理办法中提供的流程。 二线运维工程师主要负责对IaaS/PaaS/SaaS平台的运维。云运维管理体系中二线维护人员参与 的流

15、程可参照代维对象代维管理办法中提供的流程。 三线运维工程师完成效益提升域、系统保障域和服务管控域中的运维管理工作。三线维护人员 运维职责运维角色 云运维 三 线 运 维 工 IaaS/PaaS/SaaS 平台运维 二 线 运 维 工 一 线 运 维 工资源池运维 传统硬件运维 云运维管理 IaaS综合管 理平台 传统硬件 云运营管理 PaaS 综合管 理平台 SaaS综合管 理平台 SaaS资源池PaaS 资源池IaaS资源池 中国联通私有云运维管理技术规范V2.0 4 针对云运维管理进行维护。 4.2 体系框架定位 联通云运维管理体系是联通信息化部关于建设集中化云运维管理所依据的总体纲领,其

16、阐述了云运维 管理的管理领域和建设内容,是各组织人员在进行云运维管理相关建设时的建设纲领和建设标准。各组织 人员在进行云运维管理建设时,在严格遵循体系要求的前提下,根据各自的管理现状进行具体内容建设。 体系框架定义了联通云运维管理体系所涵盖的管理域,包括组织人员、流程制度、技术工具、信息管 控四个方面。 云运维管理体系在联通信息化建设架构中的定位如下图所示: 企业战略 及业务需 求 信息技术 驱动 系统管理系统架构 服务 客户企业 管理 企业资源:系统、人员和资金等 规 划 管 理 建 设 管 理 专 业 考 核 评 价 管 理 运 行 维 护 管 理 专 业 队 伍 建 设 资 源 分 配

17、云运维管理体系 IaaS PaaS 应用架构 私有云应用公有云应用 数据库中间件技术服务业务服务 计算资源 存储资源网络资源 图 4-3 云运维管理体系定位 4.3 体系架构管控策略 为了保障云运维管理体系最终的建设效果,切实提升中国联通信息化部的云运维管理水平和服务质 量,各组织人员在进行云运维管理体系建设时,需严格执行以下管控策略: 各组织人员应严格遵循本次规范的要求,保证规范内容的有效落地 各组织人员应建立量化管控机制,通过量化管控的建设落实指标化管理。 建设单位要保证规范要求中的人员配套措施落实到位,要做到职责落实到岗、落实到人。 建设单位要充分认同实现全国一体化运维/ 运营的建设目标

18、,优先开展全国一体化运维/ 运营服 务受理体系和服务台建设。 各组织人员在建设过程中需保障规范中明确提出的总部信息化部管控要求的落地实现,例如流 程建设中总部信息化部参与的要求;总部信息化部要求的管控指标等。 4.4 体系框架总图 本次云运维管理体系设计,充分参考国内外运营商和互联网企业在云运维方向上的成功建设经验和 ITIL (V3) 的最佳实践,采用PPIT 方法论,从组织人员、流程制度、技术工具、信息管控四个方面描述IT 中国联通私有云运维管理技术规范V2.0 5 服务支撑体系。具体如下:(技术工具的门户需修改成自服务门户和运维门户) 信 息 管 控 技 术 工 具 流 程 制 度 组

19、织 人 员 服务台 服务管理职能运维第三方管理职能 运维管理团队 服务管控域系统保障域效益提升域 持续优化 运维门户 运维服务管理 资源监控管理业务监控管理 服务价值域 业务指标 运维质量域 应用指标 平台指标 数据模型 服务域人员组织域资源域 服务保障域 服务指标 资源策略管理 运维需求管理 资源管理 集成管理资源配置管理统计分析 规划建设分配运维 公共资源管理职能 运维支撑团队 图 4-4 云运维管理体系框架总图 4.5 体系框架特点 4.6 云运维管理与传统IT 运维管理的差异 中国联通私有云运维管理技术规范V2.0 6 5 云运维管理要求 5.1 云运维管理体系概述 5.2 云运维管理

20、业务场景(需讨论业务场景的描述方式) 5.2.1 服务开通受理场景(普元) 5.2.1.1 场景描述 在云环境下,一切可对外提供的软、硬件资源、能力等均可视为服务。云环境下的所有服务的使 用者均视为租户。当租户申请服务后,并经过审批流程审批通过,到服务开通受理。 根据服务开通申请流程提交的申请单的详细要求,服务管理员人工进行受理。并根据租户的需求 相应派发到 IAAS、PAAS 、SAAS 层的管理员提供相应服务,当服务提供完成后,提交服务管理员,服务 管理员验证无误后通知提出申请的租户,标志服务开通受理完成。 5.2.1.2 需求分析 服务开通受理单应明确标识IAAS、PAAS 、SAAS

21、层的需求,且经过审批后要符合现有云平台能提供 的能力,如超出现有云平台能力视为无效申请,将不予受理,打回重新申请。 硬件资源申请:应指明几台虚拟机、是否集群、每台虚拟机的CPU 、内存、磁盘等参数。 软件平台资源申请:应指明web 服务器类型及版本、中间件平台的名称及版本、数据库的名称及 版本等。 软件服务申请:应指明服务接口名称,平均调用次数,最高并发调用及单次调用内存占用量,可 能存在的并发高峰期的时间范围。 5.2.1.3 解决方案 文字 中国联通私有云运维管理技术规范V2.0 7 服务开通受理流程 受 理 申 请 分 配 资 源 验 证 结 束 租户服务管理员云平台运维管理员 服务开通

22、申 请单 是否受理 资源分配 验证服务是否满 足租户需求 人工受理或自动受理拒绝受理 分配完成 不满足重新分配 服务开通 使用服务 5.2.2 服务变更场景(普元) 5.2.2.1 场景描述 场景一:租户发起的服务变更。 租户根据实现业务需求变化发起的服务变更。如系统上线过程中,前期上线5个省,已经申请了5 个省的服务资源,现在要全国上线,还需要再申请其余省份的服务资源,需要发起服务变更流程。 场景二:服务提供方发起的服务变更。 由于最终用户的需求发生变更,导致原有的服务接口中参数要发生变化。如财务系统与银行系统 对接,由于银行系统实行全国统一规范,导致服务接口变化,从而导致财务系统的服务接口

23、变化,需 要发起服务变更流程。 5.2.2.2 需求分析 (缺乏场景二的需求分析) 场景一: 租户提交变更申请单,包含两部分:一是租户要变更的服务的现状说明,需要给租户提供已经定 购的服务列表,租户可以在列表中选择相应的服务,点击可展示定购服务的全部信息,二是变更后的 服务需求,两部分要同时提交。 中国联通私有云运维管理技术规范V2.0 8 变更申请单的内容也要明确标识IAAS、PAAS 、SAAS 层的现状及需求。 服务管理员在接受变更后,可自动转派到云IAAS、PAAS 、SAAS 的各层云运维管理员,各层云系统 应与管理平台建立自动配置接口或流程贯通。 5.2.2.3 云运维管理解决方案

24、 服务变更流程 受 理 申 请 分 配 资 源 验 证 结 束 租户服务管理员云平台运维管理员 服务变更申 请单 是否受理 服务变更实 施 验证服务是否满 足租户需求 人工受理或自动受理拒绝受理 分配完成 不满足重新分配 服务开通 使用服务 5.2.3 服务撤销场景(普元) 5.2.3.1 场景描述 在云环境下,系统由于实际业务变更,已经定购的服务不再需要,需要对已经使用的服务进行撤 消,因此由租户发起服务撤消流程。 5.2.3.2 需求分析 服务撤消流程需要由租户发起对已经定购的服务发起撤消的流程。需要给租户提供已经定购的服 中国联通私有云运维管理技术规范V2.0 9 务列表,租户可以在列表

25、中选择相应的服务,点击可展示定购服务的全部信息,并从这发起服务撤消 申请。 5.2.3.3 云运维管理解决方案 服务撤消流程 受 理 申 请 分 配 资 源 验 证 结 束 租户服务管理员云平台运维管理员 服务撤消申 请单 是否受理 服务资源回 收,加入资 源库 是否回收正确 人工受理或自动受理拒绝受理 回收完成 回收不正确 撤消完成 验证撤消 5.2.4 资源稽查场景(泰岳) 5.2.4.1 场景描述 子场景与过程描述对应角色 A: 定制数据一致性、完整性、规范性资源数据稽核; 资源数据有效性稽核资源管理员 B: 资源数据可用率稽核 分配的资源长时间闲置资源管理员 分配的资源利用率过低资源管

26、理员 在资源池忙闲时分配不均,资源池利用率过低资源管理员 资源使用情况不均资源管理员 中国联通私有云运维管理技术规范V2.0 10 A 、定制数据一致性、完整性、规范性资源数据稽核 1、 资源数据有效性稽核,在云资源管理的日常活动中对相关资源信息进行校验核查,发现差错后, 触发资源核查流程进行纠正,从而保证资源数据质量。 B、资源数据可用率稽核 1、 分配的资源长时间闲置:通过监控系统提供的资源报表查看分配资源数据使用情况; 2、 分配的资源利用率过低,系统定义资源利用率阈值,当分配的资源利用率低于阈值,则分配的资 源利用率过低; 3、 在资源池忙闲时分配不均,资源池利用率过低:例如分配的资源

27、池资源数据在白天时不够用,在 夜晚时候资源过剩的情况; 4、 资源使用情况不均:有的系统使用资源过高,有的系统使用资源数据过低; 5.2.4.2 需求分析 资源管理员通过监控系统提供的资源报表查看资源使用不均的情况,申请资源重新分配,资源评审人 员收到申请后评估是否可行,如果通过审核, 转向租户审核, 租户审核通过后,系统进入资源分配子流程。 通过定制数据一致性、完整性、规范性、资源数据使用率核查规则,在云资源管理的日常活动中 对相关资源信息进行校验核查,发现差错后,触发资源核查流程进行纠正,从而保证资源数据质 量。 资源数据稽核包括数据有效性检查、数据格式检查、数据使用率检查等。资源数据稽核

28、应该包含 资源数据入库前数据验证、入库后数据核查功能、云运维管理中资源数据与IaaS/PaaS/SaaS综合 管理平台实际运行资源稽核等。 5.2.4.3 解决方案 资源数据稽核触发方式应能够支持以下两种: 即时判断,主要针对用户手工录入或者通过文件批量导入以及自动采集的资源数据进行数据 格式和有效性校验检查; 手工触发或定期自动检查云运维管理与IaaS/PaaS/SaaS 平台的数据一致性检查,可以根据资 源类型而确定选择范围,同时选定稽核规则。检查过程中,将发现的错误记录下来。 资源利用率核查, 资源稽核规则定义 根据核查规则对资源数据进行核查,并提供对核查规则的制定和查看功能。核查规则包

29、括但不限于以 下规则,需满足用户提供的多种核查规则: 固定值比较:比如某类资源的某个属性大于或小于某个固定值或在某个范围内的核查规则。 属性值比较:比如某类资源的某个属性和其他属性的比较规则。 数据格式合法性:比如日期的格式不正确、没有按照规定的格式填写特殊的字符串,应该是 数字的填写了字符、应该填写日期的地方填写了数字、必填项为空等合法性核查规则。 资源关系一致性:比如某类资源的某属性和其他资源的某属性需要一致的核查规则。 数据一致性比对管理:云运维管理中的资源数据与IaaS/PaaS/SaaS综合管理平台实际运行的 中国联通私有云运维管理技术规范V2.0 11 资源一致性比对 数据稽核结果

30、处理 系统要根据资源核查报告,提供交互式操作支持,对核查出来的差错应生成核查报告或报表, 同时通过告警通知方式统一由云运维管理的通知模块通知IaaS/PaaS/SaaS 综合管理平台管 理人员。 对于一致性检查结果,支持自动或手工纠正。对于自动纠正,系统应能定制纠正规则,默认 以IaaS/PaaS/SaaS 综合管理平台数据为准。 系统可以支持按以下几种方式供用户查看核查结果:日志、核查报表、主动提醒。 5.2.5 资源纳管场景(泰岳) 5.2.5.1 场景描述 子场景与过程描述对应角色 A: 定义 IaaS/PaaS/SaaS 综合管理平台 ID编号规则 编制资源纳管策略,为新建的IaaS/

31、PaaS/SaaS 综合管理平 台分配唯一标识的平台ID编号 云运维工程师 B: 定义规范化审计流程 对新纳管的IaaS/PaaS/SaaS 综合管理平台下发云平台配置 管理 运维管理人员 对新纳管的IaaS/PaaS/SaaS 综合管理平台进行资源配置审 计 运维管理人员 对资源配置审计未通过的新纳管IaaS/PaaS/SaaS 综合管理 平台提出资源配置整改要求 运维管理人员 C: 定义下发的运维管理要求 根据新纳管IaaS/PaaS/SaaS 综合管理平台资源信息,更新 资源管理信息 云运维工程师 A、 定义 IaaS/PaaS/SaaS 综合管理平台ID 编号规则 编制资源纳管策略,为

32、新建的IaaS/PaaS/SaaS 综合管理平台分配唯一标识的平台ID编号 B、 定义规范化审计流程 1、对新纳管的 IaaS/PaaS/SaaS综合管理平台下发云平台配置管理 2、对新纳管的 IaaS/PaaS/SaaS综合管理平台进行资源配置审计 3、对资源配置审计未通过的新纳管IaaS/PaaS/SaaS 综合管理平台提出资源配置整改要求 C、 定义下发的运维管理要求 1、根据新纳管 IaaS/PaaS/SaaS 综合管理平台资源信息,更新资源管理信息。 5.2.5.2 需求分析 将新建的 IaaS/PaaS/SaaS 综合管理平台纳管(注册)到云运维管理,为新建IaaS/PaaS/Sa

33、aS 综合管理 平台分配平台ID,通过下发云平台配置管理要求、审计资源配置、下发运维管理要求、更新资源管理信息 后,完成对新纳管资源整体管控的整个过程。 系统支持一些功能: 中国联通私有云运维管理技术规范V2.0 12 1、 分配 IaaS/PaaS/SaaS 综合管理平台ID; 2、 下发云平台配置管理要求; 3、 审计资源配置; 4、 下发运维管理要求; 5、 更新资源管理信息; 5.2.5.3 云运维管理解决方案 资源纳管的功能要求如下: 应能够根据资源纳管策略,为新建的IaaS/PaaS/SaaS 综合管理平台分配唯一标识的平台ID编号; 应能够对新纳管的IaaS/PaaS/SaaS

34、综合管理平台下发云平台配置管理要求; 应能够对新纳管的IaaS/PaaS/SaaS 综合管理平台进行资源配置审计; 应能够对资源配置审计未通过的新纳管IaaS/PaaS/SaaS 综合管理平台提出资源配置整改要求; 应能够对新纳管IaaS/PaaS/SaaS 综合管理平台下发运维管理要求; 应能够根据新纳管IaaS/PaaS/SaaS 综合管理平台资源信息,更新资源管理信息。 资源纳管的技术要求如下: 定义 IaaS/PaaS/SaaS 综合管理平台ID编号规则; 定义规范化审计流程; 定义下发的运维管理要求。 5.2.6 资源优化场景(亿阳) 5.2.6.1 场景描述 在资源池内运行的应用系

35、统,经常出现部分应用负载过低,导致严重的资源浪费,同时某些核心应用 时常资源进行或因为系统宕机导致业务中断的情况。 5.2.6.2 需求分析 资源池内包括多种硬件资源和不同的虚拟化平台,资源优化是为了上层所有应用得到更好地支撑,实 现业务应用稳定运行的同时避免资源的浪费。 5.2.6.3 云运维管理解决方案 在资源池内,将硬件(服务器、存储等)、虚拟化平台按照产品品牌分类,如下: 服务器分类如:IBM服务器、 HP服务器、戴尔服务器、华为服务器等。根据性能和故障率的统计信息 将服务器分为不同等级。 虚拟化平台分类:如Vmware 平台、 Citrix平台、 KVM 平台等。通过根据性能和稳定性

36、的统计信息将其 分为不同等级。 通过综合上述统计,管理员可设定基于不同的硬件+虚拟化平台组合的应用运行环境的等级。例如 IBM+Vmware 为一等运行环境、IBM+KVM 为二等以此类推。用户可根据自己业务的重要性为核心业务申请较 高等级的资源,边缘业务申请较低等级的资源,从而达到资源优化的效果。 5.2.7 资源回收场景(东软) 中国联通私有云运维管理技术规范V2.0 13 5.2.7.1 场景描述 5.2.7.2 需求分析 5.2.7.3 云运维管理解决方案 5.2.8 服务计量场景(东软) 5.2.8.1 场景描述 5.2.8.2 需求分析 5.2.8.3 云运维管理解决方案 5.2.

37、9 故障排查及处理场景(华胜) 5.2.9.1 场景描述 5.2.9.2 需求分析 5.2.9.3 云运维管理解决方案 5.3 云运维组织人员管理 5.3.1 服务经理 ( 亿阳 ) 5.3.1.1 职责 服务经理的职责包括:监督管理服务管理员,并对服务管理员提交上来的服务申请或变更申请做最终 的审批。 5.3.1.2 活动 服务经理的活动主要包括: 服务管理员的人员以及权限设定 服务变更最终审批:由服务管理员提交,初级变更审批由服务管理员完成,服务经理负责最终审 批(高级) SLA需求申请审批( 高级 ) ,由服务管理员提交,初级初级SLA 申请由服务管理员完成,服务经理负 责最终审批(高级

38、) 5.3.2 服务管理员 ( 亿阳 ) 5.3.2.1 职责 服务管理是整个平台的核心管理层,服务管理员负责指导资源管理员并保证云平台为用户和应用提供 可靠的服务支撑。职责包括:用户管理、订单管理、资源模板管理、服务报表、服务变更管理、系统状态 监控、在线客服、安全管理、用户备案信息管理等相关门户应用。 5.3.2.2 活动 服务管理员的活动包括: 提供基于用户或业务的服务统计报表 用户的订单和变更单(初级)的审批和投诉建议处理 提供 SLA 报表和 SLA 需求申请审批 ( 初级 ) 资源优化的发起 5.3.3 资源管理员 ( 亿阳 ) 5.3.3.1 职责 资源管理员的职责是根据服务管理

39、员的需求,管理资源池内的所有资源,确保资源对应用的良好的支 中国联通私有云运维管理技术规范V2.0 14 撑。资源是在云服务中所包含的,可用于服务用户的各类有形和无形资源。资源的类型包括虚拟机、X86 物理机、虚拟机备份、对象存储、块存储、网络带宽、公网IP 地址以及云监控等。 5.3.3.2 活动 资源管理员的活动主要包括: 资源池内物理设备以及虚拟机的健康状况的维护,如使用率,负载等 资源纳管:资源池内新添设备,老旧设备淘汰等 资源优化:记录资源的使用情况,对不同的设备、品牌、虚拟化平台的故障率做统计,推荐最优 资源优化方案 5.3.4 变更经理 ( 亿阳 ) 5.3.4.1 职责 变更经

40、理全面负责变更管理流程中的所有具体活动执行,保障所有变更依照预定流程顺利执行。通常 由具有决策权的人员担任。 5.3.4.2 活动 帮助变更管理员协调必要的变更时间、人员等方面的协调工作 审批变更请求,确保只有授权和必要的变更才被实行,并使该种变更影响最小化 成立变更咨询委员会,并领导和主持变更咨询委员会 定期召开变更会议,回顾变更 参与流程评估,对流程改进提出意见和建议,与流程负责人共同制定流程改进建议 5.3.5 变更管理员 ( 亿阳 ) 5.3.5.1 职责 变更主管通常由与变更请求内容相关的具体技术领域的负责人或直接变更处理人担任。可以根据不同 的变更种类,分派不同的人员作为变更主管。

41、变更主管主要关注在实施方案、详细实施计划等方面。 5.3.5.2 活动 检查由变更申请人提交的每一个变更请求,检查变更的正确性和必要性,必要时拒绝无关、无法 实施或没有必要的变更请求。 确定和检查变更请求的分类、变更时间要求、分析风险等。 作为具体变更的项目经理,负责领导变更的构建测试,实施和参与回顾。 制定变更实施计划、测试计划、回退计划等。 针对具体变更请求,评估并分派相应资源。 确保变更在预定的时间,资源和成本内完成。 在必要时,确保回退计划得以正确实。 负责收集与该变更有关的部门或小组的意见,综合变更对于应用的影响。 5.3.6 变更咨询委员会( 亿阳 ) 中国联通私有云运维管理技术规

42、范V2.0 15 5.3.6.1 职责 变更咨询委员会是IT 组织中对变更进行评估和决策、批准或者拒绝某个变更请求的虚拟组织,帮助变 更经理进行变更决策。 5.3.6.2 活动 针对具体变更请求,评估潜在影响和风险。 协助变更经理对变更做出审批、决策。 参加变更咨询委员会会议。 回顾失败的变更,以确保今后不再发生类似情形。 回顾已成功执行的重大变更,确保满足变更的目的。 对流程改进提出意见和建议。 5.3.7 租户 ( 亿阳 ) 5.3.7.1 职责 租户是指一个正在使用云平台所提供服务的个人、部门或联通的企业合作伙伴。租户的职责是根据自 己的业务需求向云平台提出资源的使用申请或使用已申请的资

43、源。服务申请以订单的形式提交给服务管理 员。 5.3.7.2 活动 租户的活动主要包括: 服务申请的发起:根据自身业务的需求请求服务申请 服务变更的发起:根据业务负载变化发起服务变更 SLA管理的发起:向服务管理员提供SLA 管理申请 故障申告的发起:如遇故障着则发起故障申告和投诉建议 使用咨询的发起:向服务管理员提出咨询请求 5.3.8 服务提供者 ( 亿阳 ) 5.3.8.1 职责 服务提供者根据对租户需求的调研,设定各类服务。租户和资源池之间通过服务提供者建立订购关系。 服务提供者的职责主要包括: 调研租户需求,根据业务或用户需求制定服务模板并制定服务计量计费 承上启下,根据服务管理来制

44、定资源管理规范 5.3.8.2 活动 服务提供者的活动包括: 租户所能看到的服务类型的定义 租户订单请求相应 租户的服务变更初级审批 5.3.9 租户管理员 ( 亿阳 ) 中国联通私有云运维管理技术规范V2.0 16 5.3.9.1 职责 租户管理员的职责主要包括:租户的完整生命周期管理以及状态查询和修改。 5.3.9.2 活动 主要活动租户注册、租户注销、修改租户信息、修改密码、密码重置、设置用户状态、查询用户信息、 补充用户资料等用户管理相关功能。 5.3.10 服务台接线员( 亿阳 ) 5.3.10.1 职责 负责接收所有的事件,对事件进行初步的处理,并根据实际情况将事件分派到合适的云运

45、维管理工程 师或业务系统运维管理工程师。 5.3.10.2 活动 负责 24 7 的值班和系统监控 响应客户投诉、热线电话、邮件、传真等事件报告 完整记录所有接收的事件信息,包括:记录事件报告人的详细联系方式、事件特征表现、描述、 发生时间等 为事件进行适当的分类、为事件分配优先级等属性 尝试使用工具、初步诊断、分析相关信息等方式解决问题 将事件分配给最合适的云运维管理工程师处理 检查事件记录的处理进度,保持与事件报告人的联系,适时通知事件处理进展 与用户确认事件解决方案,关闭事件 5.3.11 云运维管理工程师( 亿阳 ) 5.3.11.1 职责 云运维管理工程师负责对服务台无法解决的事件进

46、行快速有效的分析,提出解决方案以尽快恢复服务, 并在必要时提供现场支持。 5.3.11.2 活动 验证事件的描述和信息,进一步收集相关信息 进行深入调查研究或协调厂商支持,提供有效的解决方案 实施事件解决方案 更新事件解决信息,已解决的事件转回服务台 5.3.12 业务系统运维管理工程师( 亿阳 ) 5.3.12.1 职责 业务系统运维管理工程师是相关问题领域的专家。负责提供对云运维管理工程师无法解决的问题进一 步进行调研,找出解决方案并尽快恢复服务。 5.3.12.2 活动 中国联通私有云运维管理技术规范V2.0 17 验证事件的描述和信息,进一步收集相关信息 进行深入调查研究或协调厂商支持

47、,提供有效的解决方案 实施事件解决方案 更新事件解决信息,已解决的事件转回服务台 5.3.13 运维经理 (亿阳 ) 5.3.13.1 职责 根据需要在系统中制定作业计划。 5.3.13.2 活动 作业计划的制定。 5.3.14 运维管理员 ( 亿阳 ) 5.3.14.1 职责 对作业计划进行审批,同时对作业计划执行的结果进行审核;并负责的值班调度工作。 5.3.14.2 活动 审批作业计划 定期安排值班工作 对值班人提出的班次调度进行审核确认 通过值班日志以及值班作业计划记录定期检查值班人员的工作情况 对值班过程中所遇到的问题进行协调 5.3.15 审计员 ( 亿阳 ) 5.3.15.1 职

48、责 审计员的职责是对云平台中相关资源的操作行为进行审计跟踪分析和监督检查,以及时发现违规行 为。 定期分析相关业务操作人员业务处理过程日志文件,定期检查运维记录,对可疑的信息进行审计和跟 踪控制,发现违规活动即时向运维负责人进行汇报。 审计员定期提交审计报告。 5.3.15.2 活动 资源审计合规检查 5.3.16 优化咨询委员会( 亿阳 ) 5.3.16.1 职责 优化咨询委员会的职责是对资源池内的资源优化方案的评估。委员会成员由资源管理员、服务管理员、 服务经理、应用维护人员以及其他云计算专家组成。资源管理员或服务管理员通过对系统的运维和监控提 出资源的优化方案并提交给优化咨询委员会。 5

49、.3.16.2 活动 优化咨询委员会的就已提出的优化方案进行评估和审批,决定是否采用特定的优化方案。 中国联通私有云运维管理技术规范V2.0 18 5.4 云运维流程制度管理(需讨论对每个流程的描述方式:流程定义()、流程图、流程说明?流程图 也需统一格式) 5.4.1 用户服务域 5.4.1.1 服务申请类(普元) 5.4.1.1.1 标准化服务申请流程 5.4.1.1.1.1 流程定义 5.4.1.1.1.2 流程图 ( 定义角色:租户申请( 经过租户领导审批的申请) 、系统判断资源是否符合需求?返回成功或失败信 息, 一个判断,成功返回开通成功,失败通知租户。) 标准化服务申请流程 服务台租户 开始 租户提交经租户领 导审批过的服务目 录申请单 是否满足租户 申请需求? 开通租户申请的服 务 是 服务开通成功 结束 提示标准化服务申 请失败 否 更新资源库 是否开通 SLA 服 务 否 SLA 开通及变 更流程 是 5.4.1.1.1.3 流程说明 (需由系统管理员设定一个阈值,超过阈值走工单申请)本流程只适用于小批量申请,大批量走工单 申请,系统可配置。 中国联通私有云运维管理技术规范V2.0 19 租户申请为经过租户领导审批的申请,属于线下流程,系统外流程。) 5.4.1.2 服务变更类(普元) 5.4.1.2.1 服务延期申请流程

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1