1、浪潮应用监管系统浪潮应用监管系统技术白皮书浪潮(北京)电子信息产业有限公司 | 2014年7月目录1市场背景22产品介绍33产品架构43.1产品系统架构43.2产品关键技术53.3产品部署模式64产品功能74.1深度全面的资源监测74.1.1网络安全设备管理74.1.2服务器系统管理74.1.3数据库及中间件管理84.1.4基础应用平台及通用服务管理94.1.5虚拟化平台监测104.1.6基础运行环境管理104.1.7各资源类型监测版本支持情况104.2面向业务的监控114.2.1业务应用总控视图(一级)114.2.2资源运行展现视图(二级)114.2.3监测指标分析视图(三级)114.3智能
2、准确的告警预报124.3.1集中化告警管理124.3.2灵活的告警通知134.4深入量化的报表统计135产品特点145.1面向业务的监测145.2深度监测、易于部署145.3配置灵活、上下扩展145.4易用、安全、稳定146运行环境及要求157公司简介1617 / 181 市场背景企业IT 系统越来越多,网络、设备和产品越来越复杂,企业的各项经营活动越来越依赖于稳定可靠的业务应用系统的支撑。面对着复杂多样的 IT 网络和业务支撑系统,信息部门面临着诸多挑战:n 如何最大程度的提前发现和改善 IT系统中的不稳定因素?n 如何满足信息部门复杂的IT 资源不同层面的监控和管理需求?n 如何从业务角度
3、提高质量,保证业务使用部门的满足度?n 如何实现 IT 资产和运行情况的统一管理分析,为 IT 系统建设提供量化的决策依据?作为浪潮产品系列中的业务管理产品,浪潮应用监管系统应运而生。2 产品介绍浪潮凭借多年的相关软件开发和实施经验,结合国内管理实际情况,并在充分吸收国外先进网络管理理论的基础上,研制开发出了浪潮应用监管系统(简称“浪潮SSM”)。该系统能够帮助用户及时的发现IT系统运行中所存在的问题,做到异常事件早发现、早解决,既提高了信息系统的运行效率,又增强了企业的故障应急处理能力。面对用户日益复杂的IT环境,浪潮应用监管系统(浪潮SSM)将以往对网络、服务器与业务应用、安全设备、客户端
4、PC和机房基础环境等的分割管理进行了有效的整合,实现了全面监控与集中统一管理;并融入了基于ITIL理念的IT服务管理,实现了技术、功能、服务三方面的有机结合,从而提高了企业IT系统的运行管理水平和服务能力,为企业生产和日常办公提供高效、贴身的保障。浪潮应用监管系统(浪潮SSM)是浪潮在多年系统管理和服务经验积累之上,推出的业务系统监控解决方案,定位于对应用服务、安全设备、网管系统、基础支撑系统等一系列资源的不间断监控,是一套能够对网络基础平台和业务支撑系统进行统一监控的业务监控管理平台。浪潮应用监管系统(浪潮SSM)面向国内客户的业务环境和管理模式,加入了客户和市场迫切要求的重要特性,融合了国
5、内外的监测技术发展趋势,可满足在复杂的IT环境下实施面向业务系统的监控需求。系统为客户提供直观、全面、多角度的视图,动态监测业务应用的运行,对影响正常运转的事件快速响应,帮助信息部门建立主动化管理模式,实现对IT 资源和IT资源的高效管理,提升业务服务质量,从而保障 IT 信息系统的可持续性发展。图2-1 浪潮SSM产品概念示意图3 产品架构3.1产品系统架构图3-1浪潮SSM系统架构图浪潮应用监管系统(浪潮SSM)系统架构分为五层:n 基础资源层包含网络设备、服务器系统、数据库、中间件、基础应用平台、通用服务管理和基础运行环境等被监测资源。n 数据采集层数据采集层包含监测采集器、采集探针和监
6、测数据接收几部分:监测采集器利用HTTP、SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX、CORBA等标准协议和各种业务系统专有协议实现远程监控和数据采集,同时也支持SSM Agent代理式监测采集被管资源的监测数据。监测采集器运行在采集探针(Probe)内,采集探针可以分布式部署,满足多个隔离子网和多级大规模IT环境监测的要求。监测数据接收模块接收各个采集探针上报的数据,并交由数据处理层统一处理。n 数据处理层性能数据经过整理、归并与挖掘处理,为上层提供可靠参考;同时故障数据经过过滤、压缩、归并与关联分析之后,产生告警信息与事件记录。n 业务模块层提供全面业务功能支撑
7、展现监测分析结果。监测配置:各类监测任务配置,监测调度和阈值管理。资源管理:面向资源监测与数据汇总。业务管理:业务应用与业务影响模型建模。业务拓扑:业务拓扑视图管理告警管理:智能告警处理与展现。统计分析:各类数据的统计和分析报表支撑。n 功能展现层用户接入方式与WEB客户端功能展现。3.2产品关键技术浪潮应用监管系统(浪潮SSM)的产品关键技术有:n 基于J2EE平台,B/S展现模式,采用先进的业务框架,良好的互操作性和扩展性,轻松实现跨平台部署。n 默认数据库为Oracle 10g。n 内嵌WEB应用服务器,简化配置、优化性能、加固安全。n 支持监测配置集中管理,分布式探针(Probe)监
8、测采集部署,满足多个隔离子网和多级大规模IT环境的统一监测管理要求。n 主机监测提供远程无代理和UniAgent代理两种模式。n 强大的监测插件体系,确保监测功能和指标的可扩展性。n 内置智能事件分析引擎,通过业务影响依赖关联模型iBDM自动分析事件关联。n 遵循各类标准化协议与规范ICMP、SNMP、JMX、Corba、CLI(Telnet、SSH)、WBEM/WMI、HTTP、HTTPS、LDAP、DNS、FTP/POP3/SMTP3.3产品部署模式图3-2浪潮SSM产品部署示意图浪潮应用监管系统(浪潮SSM)产品支持分布式监测采集部署与集中配置管理模式,通过在服务端集中配置采集策略,然后
9、下发到采集探针(Probe)执行周期采集任务,完全可以满足在大规模网络环境下的对IT基础设施的监测要求。客户端无需任何安装,直接通过浏览器查看各类IT资源的即时性能指标,方便快捷。浪潮应用监管系统(浪潮SSM)系统采集探针(Probe)具有以下几大特性:n 探针自带监测数据存储功能:在网络临时中断或服务端临时关闭的情况下,Probe端会临时存储监测数据(Probe关闭后也不会丢),待网络和服务端恢复后再向服务端传输数据,保证监测数据的完整性。n 探针支持自我管理和故障自恢复:当采集探针由于某些原因无法正确运行时,探针会自动重启并迅速执行监测任务,保证监测数据的连续性。n 探针支持自动升级功能:
10、当探针有新版本发布时,只需要把探针升级程序发布到服务端固定的目录,探针会自行判断并升级到新版本,减少手工升级带来的成本和出错几率。n 探针提供自动注册功能:采集探针在启动时会自动根据配置信息连接到服务端进行自动注册,增加了管理的方便性。n 探针支持多种常见平台部署:采集探针可在Windows和常见类Unix操作系统下部署,并能以服务模式运行(默认提供Windows操作系统下的安装程序)。4 产品功能4.1深度全面的资源监测浪潮应用监管系统(浪潮SSM)集网络安全设备、应用服务和基础支撑系统等监测管理于一体,支持SNMP、Syslog、CLI(Telnet、SSH、WMI)、JMX、CORBA等
11、远程监控手段和SSM UniAgent代理监测,各类标准应用协议仿真,拥有了500多种监测器,提供对整个业务网络的7*24不间断监控。n 强大监测插件体系无需二次开发,通过监测插件,不断增加监测器数量,扩展监测范围与内容。众多监测器工作独立,互不影响,保证整个监测体系的稳定运行。n 灵活的监测时间调度机制和智能化的监测阈值模型自定义监测时间与监测阈值,形成多样化、组合型监测策略,满足复杂环境下不同的监测任务要求。n 主机代理Agent监测和远程无代理监测两种监测模式多方式、多手段的自由组合,兼顾业务网络各部分性能影响,适应不同监测条件。4.1.1网络安全设备管理全面支持CISCO、华为、中兴、
12、北电、Foundry、Extreme、Avaya、H3C、DLink等各种不同厂商、不同型号的网络与安全设备,提供各类设备的基本信息、CPU / MEM负载状况,设备可用状态、连续运行时间、响应延时、端口速率、ICMP连通性等设备属性与监测信息,亦可自定义SNMP监测内容。网络设备监测项包括:设备CPU利用率、设备内存利用率、端口速率监测、端口上下线监测、自定义SNMP监测、ICMP连通性监测等4.1.2服务器系统管理管理和监测Windows、Linux、IBM AIX、AS/400、HP-UX、SUN Solaris、SCO Unix 、SGI、Tru64等不同操作系统的服务器或集群的运行状
13、态和性能数据,包括服务器的基本信息、CPU负载、内存利用率、应用进程、文件系统、磁盘空间和吞吐、事件与错误日志等信息的分析与监视。帮助用户及早发现服务器系统的性能瓶颈与故障隐患。服务器监测项包括:主机基本信息采集、主机CPU使用率、主机内存使用率、主机磁盘使用率、主机磁盘IO监测、应用进程监测、系统服务监测、主机当前登陆用户信息、主机端口速率监测、主机重要文件监测、Job基本信息采集(AS/400)、ICMP连通性监测、HACMP集群状态监测、自定义指标监测等。4.1.3数据库及中间件管理根据预定义的监测项目对Oracle、SQL Server、Sybase、DB2、Informix 、MyS
14、QL等多种数据库,按照属性相关性分为数据库工作状态、数据库表空间的利用情况、数据文件和数据设备的读写命中率、数据碎片的情况、数据库的进程状态、数据库内存利用状态等属性监测组,分组监测数据库系统的性能、事务、连接等性能数据。DB2数据库监测基础监测、缓冲池信息监测、锁监测、锁表信息、排序信息监测、表空间监测、表空间容器监测。Oracle数据库监测基础监测、高级队列监测、归档目的地监测、基本信息采集、检查点监测、数据文件监测、全表扫描配置、资源锁定监测、碎片监测、PGA配置、进程资源消耗监测、命中率监测、递归调用信息监测、会话监测等。MySQL数据库监测基础监测、数据库大小监测。SQL Serve
15、数据库监测基础监测、基本信息(阻塞进程数、处理器名称、Windows版本、处理器数目、主机名、内存(MB)、数据库数目、会话数目、启动时间)、数据库大小、文件监测、会话监测。Informix数据库监测基础监测、检查点监测、DbSpace监测、磁盘读写监测、锁监测、日志读写监测、共享内存监测、排序监测、事务监测等。Sybase数据库监测基本信息采集、数据库监测、会话监测、事务监测、设备监测、数据库:CPU使用率、数据库空闲表空间、数据库表空间、连接会话数等。产品还支持对Websphere、WebLogic、MQSeries、Tomcat、Tuxedo、Tibco、Resin、TongWeb、金蝶
16、Apusic等各类不同中间件,提供包括配置信息、连接池、线程队列、负载监测、通道情况监测等多类监测组,分析与监测中间件的各项运行状态参数。中间件监测项包括:中间件基本系统信息采集、JVM使用监测、JDBC链接池监测、JTA事务监测、线程池监测、Servlet监测、EJB监测、WEB应用监测等。4.1.4基础应用平台及通用服务管理提供对IIS、Apache、Exchange、Domino等基础应用平台的基础信息、连接测试、基本负载等重要信息的监测。有效实时地分析HTTP/HTTPS、DNS、FTP、DHCP、LDAP等常见通用服务的运行状态和参数,深入分析服务响应速度变化的技术原因和规律,从根本
17、上解决服务响应性能的问题。Domino服务器监测基础监测、基本信息采集、负载监测、复制(Replication)监测、邮件服务监测、缓冲池监测、扩展管理池监测。Apache负载监测监测服务器是否连接,采集CPU负载、正常运行时间、响应时间、累计访问数、累计访问数据处理、每秒请求数、每秒处理字节数、每请求处理字节、忙作业数、空闲作业数等指标。IIS监测连接监测、传输字节监测、用户监测、WEB请求监测。WEB服务器可用性监测监测http、https和Web Service服务器是否连接以及是否正常运行,可以监测指定http的URL路径是否包含或者不包含指定内容。标准邮件服务器监测监测pop3、sm
18、tp邮件服务器是否连接以及是否正常运行,可以监测具体的邮箱的邮件数以及邮箱使用量。Active Directory服务监测监测AD服务运行情况,对请求的响应情况,服务复制列表情况。Exchange服务监测:访问监测、SMTP信息监测、MTA信息监测、邮箱存储信息监测。基础服务监测:DNS服务监测、FTP服务监测、LDAP服务监测。通用资源监测:TCP端口监测、通用SNMP监测。4.1.5虚拟化平台监测对虚拟化平台的监测主要以VMware为主。主要监测虚拟机常见的性能指标如CPU、内存、磁盘。VMware监测基本信息采集、虚拟机CPU监测、虚拟机内存监测、虚拟机磁盘监测、集群信息采集等4.1.6
19、基础运行环境管理对于IT环境系统,我们支持各种智能设备的快速监测,同时通过SNMP、数据库接口等其他接口方式可以实现客户化的扩展监控,监测内容包括基础运行环境的温度、湿度、漏水、烟感和电源、UPS、智能空调等。4.1.7各资源类型监测版本支持情况表4-1 浪潮SSM资源监测版本资源大类资源小类支持版本网络设备路由器、交换机、防火墙v1 v2 v2c服务器LinuxRedhat el3.x el4.x el5.xRedhat AS4.x, AS5.xCentOS 5.x 6.xUbuntu 10.x, 11.xWindowsWindows 2003/2008 x86/x64Solaris9.x,
20、 10.xHP-UX11.xAIX5.1, 6.xFREEBSD5.xIRIX646.xSCOUNIX5.xAS4004.xTRU646.x中间件Websphere5.2.x, 6.0.x, 6.1.x, 7.0.x注:暂不支持7.0版本的servel监测Weblogic8.x, 9.xTomcat5.x, 6.xTongweb5.xDomino5.x, 6.x, 7.xTuxedo8.1.x, 11.x通用JMSIBM MQ5.x, 6.xRESIN Service3.0.x数据库Oracle9i, 10g, 11gMSSQL2000, 2005, 2008Sybase12.xMysql5.
21、xDB28.0, 9.7Informix7.x, 8.x, 9.xPostgresql9.0.xWEB服务器Apache1.x, 2.xIIS5.x, 6.x虚拟化平台vCenter5.x, 5.xESX4.x, 5.x4.2面向业务的监控浪潮应用监管系统(浪潮SSM)通过业务和服务模型来管理IT资源,业务应用监控视图由整体到局部逐层钻取,从粗线条到细颗粒度的导航模式,方便运维人员深入浅出的分析当前被监控资源的运行状态,定位问题发生的故障根源并评估影响度。SSM提供业务应用总控视图、资源运行展现视图及部件指标分析视图等三级视图呈现,方便用户便捷的获取业务SLA和服务响应指标。4.2.1业务应用
22、总控视图(一级)以业务为核心,全局展现所有业务应用运行状况的一级视图,即业务应用总控视图;它把与业务运行相关的资源动态关联起来,并以业务拓扑的形式呈现,用户可以根据资源对业务的影响度定义不同的影响权重进行计算,得出业务的健康状态与可用状态,更加贴合用户的管理思路;业务应用总控视图还直观的呈现了最近24小时业务的可用性和健康性,方便用户快速定位到最近的故障时间点。4.2.2资源运行展现视图(二级)针对业务应用的具体关联资源,根据不同的资源分类(如网络设备、服务器、数据库、中间件等),详细展现资源的基本信息、负荷状况、稳定性、响应延时各项关键性能指标和健康度与可用度的状态分析,轻松掌握资源当前的运
23、行状况。4.2.3监测指标分析视图(三级)自定义查询区间,展现区间内各时间点被监测资源的关键性能指标,帮助用户把握总体走向,捕捉细节变化,粗细结合地利用图表比较、分析详细性能趋势,并支持分析结果单独导出与发送。4.3智能准确的告警预报业务系统网络经常会产生各种各样的故障信息,如何快速识别、定位故障信息与故障原因,是IT信息部门尽早尽快排除故障的先决条件。4.3.1集中化告警管理强大灵活的事件分析智能识别各类不同来源的原始事件。通过内建的智能事件分析引擎,对标准化后的原始事件进行可靠过滤、重复压缩、对齐归并与依赖关联,自动修正告警记录,最终形成有效告警。n 自定义事件解析规则用户可自定义编辑和导
24、入解析规则库文件,自主制定事件解析规则,同时支持第三方MIB库的装载与自动解析。n 基于iBDM的事件关联分析事件的产生以及其影响都不是独立的。基于业务影响依赖模型iBDM的事件关联分析,自动发现关联,追溯事件影响、定位问题,发现问题根源。图4-9事件分析机制与流程告警台作为告警管理平台,呈现最新告警信息,并以最近24小时、最近一周、最近一个月等不同区间统计最近的告警记录,提供自定义刷新、告警确认与消除等告警管理操作。n 分等级告警产生的告警信息分为提醒、警告、次要、重要、紧急五个等级,用户可以根据告警等级安排告警处理的优先次序。n 分类查询借助按资源与按节点的分类导航,快速搜索分类告警记录;
25、支持通过告警信息的事件等级、时间、类别、名称、资源等组合条件进行自定义查询。n 告警的关联特性点击具体告警,会列举告警关联的事件,同时展现事件的详细信息、问题资源信息和依赖关系图等,方便分析故障详情。4.3.2灵活的告警通知多样的通知方式支持短信、邮件、语音等告警通知手段。支持外部命令、UniAgent执行脚本、NetSend、Snmp设置、Trap转发等告警处理动作。告警处理将按预定义,自动在告警发生后执行,先一步尝试恢复业务。灵活的通知策略根据不同的告警事件来源指定不同的通知和处理方式,组成全面告警通知策略。4.4深入量化的报表统计全面的性能与告警报表依据对监测数据的自动汇聚、抽取、分析,
26、提供基础架构性能与告警、资源比较、指标排名、指标趋势等各类层次化统计分析报表。从业务运行状态到微观性能指标,自定义查询业务应用系统及其关联资源的当前和历史运行情况。业务运行报表支持按业务的方式对业务应用可用性、MTTR和MTBF进行统计。节点报表支持按节点的方式对其监测数据的进行汇总分析,提供基础架构性能指标趋势等各类层次化统计分析报表,并支持自定义时间段进行查询。“所见即所得”的报表支持报表收藏功能和订阅。支持导出为Excel、PDF文件和立即发送报表到指定Email邮箱,还能够为不同的用户订阅相关报表,自动定时发送到指定Email邮箱,提供系统优化、决策分析和业务规划的量化参考。5 产品特
27、点5.1面向业务的监测浪潮应用监管系统(浪潮SSM)提供以业务组织为核心,面向业务的监测模式,并通过独创的业务影响依赖模型iBDM,进行业务的故障根源分析,真正实现了基于业务视角的监控。系统通过业务监测拓扑和业务展现视图,多角度分析展现业务监测结果,衡量业务运行状态,评估业务服务水平,使用户能够站在业务的高度运筹帷幄,对业务进行有效管理。5.2深度监测、易于部署浪潮应用监管系统(浪潮SSM)遵循各类标准化协议与规范,通过丰富的监测器满足各种网络设备、服务器系统、数据库、中间件、基础运行平台与通用服务等多样性监测需求,做到即开即用。提供主机代理Agent监测和远程无代理监测两种监测模式,自由组合
28、兼顾业务网络各部分性能影响,满足各种差异化监测环境下的不同监测条件。客户端无需配置,服务端一次安装,即可完成对整个业务系统网络的监控。系统的安装实施与维护操作轻松简便,对现有系统性能影响甚微。5.3配置灵活、上下扩展无论是监测配置、告警配置还是报表配置,浪潮应用监管系统(浪潮SSM)都提供模板化的配置支持,帮助用户实现快速定制。同时,多元化参数设置,允许用户充分地配置自定义,满足各类复杂监测要求。用户可自定义编辑和导入事件规则库文件,自主制定事件解析规则,同时支持第三方MIB库的装载与自动解析。浪潮应用监管系统(浪潮SSM)稳定的插件管理体系,提供了标准的插件实现接口,无需二次开发即可完成特
29、定的业务监测和管理功能。同时开放的扩展接口允许监测功能的添加或者与其他系统的集成。产品还支持第三方告警接入,通过Syslog、SNMPTrap集成其他系统的故障信息。5.4易用、安全、稳定浪潮应用监管系统(浪潮SSM)主要面向信息系统运行维护人员,在原始数据的有效组合和表现形式上,处处体现出服务于运维的设计原则。产品采用B/S架构,全中文WEB 界面,易用友好。提供全程导航,快速定位,引导式简易操作,轻松掌控整个监控环境。层次化运行展现,方便获取各层次监测数据,可形成多种格式文档即时导出。为了满足监控数据的安全传输,无论是Agent还是远程监控方式,产品均支持可选的SSH加密方式,保证数据在传
30、输过程中的安全。6 运行环境及要求浪潮应用监管系统(浪潮SSM)支持主流操作系统,包括主流商用Windows、Linux和UNIX系统等。推荐在Windows 2003平台下安装程序。表6-1浪潮SSM运行环境配置运行环境配置项目具体配置要求服务端操作系统推荐采用Windows 2003 with SP1/SP2操作系统CPU2.0GHZ以上,建议XEON CPU 2.0GHZ x4或以上内存4G或以上内存,空闲内存大于2G硬盘200G 空闲硬盘(含DB),RAID5,SAS硬盘网卡1000M以太网卡采集探针(Probe)操作系统推荐采用Windows 2003 with SP1/SP2操作系
31、统CPUCPU 2.0GHZ内存2G以上内存,空闲内存大于1G以上硬盘50G 以上空闲硬盘空间网卡100M以太网卡,建议1000M以上网络环境探针所在的服务器与服务端HTTP-8899(默认情况)端口能相互正常传输数据,另须配置防火墙或安全隔离设备Web客户端操作系统Windows 2003/XP/7,最低IE6,推荐IE7、IE8CPU1.6GHz 以上内存512M内存,建议空闲内存大于256M网卡100/1000M网卡数据库数据库版本Oracle 9i/Oracle 10g/Oracle 11g数据库空间数据库存储空间不少于10G,建议数据库空间30G以上7 公司简介浪潮自1996年开展网
32、络安全技术研究以来,专注于高端安全技术的研究和安全产品的开发。作为国内信息安全产品和方案供应商,浪潮信息安全多次承担国家863计划重大科技攻关项目,参与国家信息安全领域国标的制定。2006年,浪潮自主研发的主机安全增强系统(浪潮SSR),填补了国内产品空白,连续9年获得国内服务器安全加固产品品牌影响力第一位。同年,推出的Web卫士产品(单机版),所推出的网站安全解决方案深受广大用户喜爱。随着计算及业务逐渐向数据中心高度集中发展,Web业务平台已经在各类政府、企业机构的核心业务区域,如电子政务、电子商务、运营商的增值业务等中得到广泛应用,很多企业都将应用架设在Web平台上,Web成为一种普适平台
33、为保证Web应用系统的安全性,在2012年浪潮自主研发浪潮Web应用防火墙,一经推出受到了客户的好评。2013年浪潮推出了我国第一个数据中心主机安全整体解决方案(浪潮安全应用交付系统SSA、浪潮运维安全管控系统SSC、浪潮主机安全增强系统SSR和浪潮应用监管系统SSM),并再次受到客户和国家的关注与重视。在云计算时代,作为中国软硬件综合实力最雄厚的IT企业,浪潮以创新的精神,务实的态度,为客户提供优质的安全产品和服务,致力于中国信息安全建设。浪潮相信,务实造就成功,创新成就未来。浪潮将继续秉承“求实、创新、团结、进步”的宗旨,在信息安全领域内不断开拓进取,为民族信息安全产业发展做出应有的贡献。浪潮(北京)电子信息产业有限公司,北京市海淀区上地信息路2号国际创业园C栋Copyright2013 浪潮(北京)电子信息产业有限公司保留一切权利免责声明:虽然Inspur试图竭尽全力来确保手册内载之信息的准确性和完善性,但不保证本资料的内容不含有技术性误差或印刷性错误,为此Inspur对本资料中信息的准确性不承担任何责任。浪潮保留可随时更改文档内所记载之硬件及软件规格的权利,而无须事先通知。