基于SUPANET的故障恢复研究_网络硕士论文.doc

上传人:来看看 文档编号:3921831 上传时间:2019-10-10 格式:DOC 页数:71 大小:1.10MB
返回 下载 相关 举报
基于SUPANET的故障恢复研究_网络硕士论文.doc_第1页
第1页 / 共71页
基于SUPANET的故障恢复研究_网络硕士论文.doc_第2页
第2页 / 共71页
基于SUPANET的故障恢复研究_网络硕士论文.doc_第3页
第3页 / 共71页
基于SUPANET的故障恢复研究_网络硕士论文.doc_第4页
第4页 / 共71页
基于SUPANET的故障恢复研究_网络硕士论文.doc_第5页
第5页 / 共71页
点击查看更多>>
资源描述

《基于SUPANET的故障恢复研究_网络硕士论文.doc》由会员分享,可在线阅读,更多相关《基于SUPANET的故障恢复研究_网络硕士论文.doc(71页珍藏版)》请在三一文库上搜索。

1、西西 南南 交交 通通 大大 学学 研研 究究 生生 学学 位位 论论 文文 基于 SUPANET 的故障恢复研究 Classified Index: TP393.05 U.D.C: 618.14 Southwest Jiaotong University Master Degree Thesis RESEARCH ON RECOVERY BASED ON SUPANET MAY, 2007 Grade: 2004 Candidate: Chen Meiliao Academic Degree Applied for: Master Major: Computer Application Su

2、pervisor: Dou Jun 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第I 页页 摘要摘要 Internet 是上一世纪七十年代以文本数据传输为主的应用背景下诞生的网 络,因此对正确性要求高,对实时性要求低。但随着多媒体网络应用数据流在 Internet 中的增加,使得 Internet 的“尽其所能”的服务难以满足新数据流 的服务质量的需求,成为 Internet 面临的一大挑战。虽然 Internet 学界试图 通过在 IP 层上增加服务质量保障技术,如资源预留协议、集成服务、区分服 务,来改进 Internet 的服务质量。但现有的 Internet 的三层

3、数据传输平台用 户数据传输效率低,实施服务质量控制困难。 针对现有网络体系结构在服务质量保障方面存在的不足,四川省网络通信 技术重点实验室提出了“单物理层用户数据传输与交换平台体系结构”(SUPA Single Physical layer User-data transfer quality of service; fault restoration ;protection switching; VP: virtual path ;Simulation tool OPNET; 目录目录 第 1 章 绪论 1 1.1 本课题的研究的背景 .1 1.1.1 三网合一的大趋势 1 西南交通大学硕士

4、研究生学位论文西南交通大学硕士研究生学位论文 第第V 页页 1.1.2 现有网络体系结构存在的问题 2 1.2 SUPA 的提出 4 1.3 国内外研究现状与本课题的研究意义 .5 1.4 本论文的组织安排 .6 第 2 章 SUPA 技术框架 .7 2.1 基本术语 .7 2.2 带外信令控制技术 .8 2.3 SUPA 的协议层次模型和接口 8 2.4 SUPA 基本工作过程 .11 2.5“面向以太网帧时槽交换” (EPFTS)技术 .12 第 3 章 网络故障恢复的层次考虑 .16 3.1 网络故障恢复的概述 16 3.1.1 网络中可能出现的各种故障 .16 3.1.2 不同业务对故

5、障恢复的不同要求 .17 3.1.3 网络故障恢复的目标 .17 3.2 现有网络中的各种故障恢复方法 18 3.2.1 DWDM 层故障恢复技术 18 3.2.2 IP 层故障恢复技术 21 3.2.3 MPLS 故障恢复技术 22 3.2.4 SDH 故障恢复技术 .23 3.2.5 ATM 故障恢复技术 .24 3.3 故障恢复的层次考虑 25 第 4 章 SUPANET 的故障恢复 .27 4.1 SUPANET 故障恢复技术分析 27 4.1.1 SUPANET 故障恢复的必要性 .27 4.1.2 SUPANET 故障恢复思想概述 .27 4.1.3 SUPANET 保护切换方法的

6、分类 .30 4.1.3 SUPANET 故障恢复基本过程 .32 4.2 QoSNP 介绍 34 4.2.1 QoSNP 概述 .34 4.2.2 QoSNP 的基本工作原理 .35 4.3 QoSNP 用于虚通路保护的扩展 36 4.3.1 恢复参数 .36 4.3.2 记录路径参数 .37 4.3.3 备份路径参数 .38 4.4 虚通路的建立 39 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第VI 页页 4.4.1 普通虚通路的建立过程 .39 4.4.2 受保护的主虚通路的建立 .41 4.4.3 路径保护方法中备份虚通路的建立 .41 4.4.4 局部保护中备

7、份虚通路的建立 .43 4.4.5 备份虚通路与主虚通路的绑定 .44 4.5 虚通路失效的检测 46 4.6 用户数据平台的转发 47 4.7 切换后主虚通路的维护 50 4.7.1 场景描述 .50 4.7.2 工作过程 .50 4.7.3 原虚通路资源的释放 .51 第 5 章 SUPANET 故障恢复仿真 .53 5.1 OPNET 仿真平台 53 5.1.1 OPNET 的概述 .53 5.1.2 OPNET 的特点 .53 5.1.3 OPNET 的建模过程 .54 5.2 模型仿真及结果分析 55 5.2.1 仿真的网络场景 .55 5.2.2 仿真的数据走向 .56 5.2.3

8、 数据统计及分析 .58 结论及展望 60 致谢 62 参考文献 63 攻读硕士学位期间发表的论文 67 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第1 页页 第 1 章 绪论 1.1 本课题的研究的背景 本课题的研究大背景是四川省网络通信技术重点实验室关于下一代 Internet 体系结构的研究工作。通信技术高速化和网络应用数据的多媒体化传 输使传统的 Internet 技术难以满足实时音、视频数据的传输服务质量需求和 网络高速化的要求。因此,实验室提出了单物理层用户数据传输与交换平台体 系结构(SUPA Single physical layer User-data

9、transfer 第三,重选一条可用的通道;第四,称为业务流的切 换(switch over)过程,即将业务流从出故障原通道切换到由第三个功能计算所得 的新的路径。 3.1.1 网络中可能出现的各种故障 在网络中的任何资源都有可能发生故障。传统的故障主要是由人为造成的 链路中断;如有电缆脱离绝缘外表皮;对于光缆来说,还可能是由于激光器停 止工作或而丢失光信号(LOL) 。所有这些都有可能造成网络数据传输业务的 中断33。 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第16 页页 典型的问题还有路由器或交换机的故障,整个交换机/路由器可能瘫痪。 这可能由于电源中断,交换机/路

10、由器中非冗余部件的损坏。当交换机/路由器 发生故障之后,由交换机/路由器通往其它交换机/路由器的链路以及其它交换 机/路由器接往该交换机/路由器的链路都会陷入瘫痪。交换机/路由器的故障可 能是由于硬件原因导致也有可能是软件原因所导致的18,19,33。 3.1.2 不同业务对故障恢复的不同要求 通讯网中各种不同的用户和业务因其业务的特性对网络的故障恢复能力的 有着不同的要求。根据用户类型可以分为以下几种14-16: 安全保护级别高的用户:(如医院、警察局、消防部门等)由于安全的原 因这些用户必须时刻保证服务质量,服务的间断对于他们来说是不允许的。 一般的商业用户: 这些用户会因为网络服务中断而

11、导致一些商业损失。 基本级别的用户:这些用户的级别是最低的,如网络中出现故障或拥塞时 这种用户的业务数据流可能会被丢弃,资源可能会被上述几种用户抢占以保证 上面几种用户的服务质量。 根据业务类型可以分为以下几种: 将来的网络将运行的业务会有传统的电话业务流,电话语音服务,电视电 话,电影、新闻、Internet 访问、电视购物和其它各种各样的业务。这些业务 不仅对于带宽的要求不同而且对于时延和对故障恢复的要求也不尽相同。因而 运营商一般根据用户的不同的服务质量要求,向用户收取不同的服务费用。 3.1.3 网络故障恢复的目标 简单地说,在一个网络中恢复故障的关键目的就是尽可能地缩小故障所引 起对

12、数据传输的影响。具体而言可以分为以下几个目标: (1)最大化网络的可靠性和效率; (2)对于不同的用户和业务提供不同的故障恢复能力; (3)提高故障恢复的速度; (4)考虑网络不同层次的故障恢复行为,避免网络各层相互反作用和协调各 层之间的协作。 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第17 页页 (5)最小化因故障所引起的数据丢失和业务数据流乱序而对业务流产生的负 面影响。 (6)最小化因采取故障恢复所需要的信令复杂性和附加的一些操作。 3.2 现有网络中的各种故障恢复方法 从宏观上看,网络恢复可以分为两大类:业务层的恢复和传送层的恢复23。 前者主要用于业务层网络

13、,如交换网、ATM 网络和 IP 网络等;后者主要用于 传送网,又称为设施恢复。业务层的恢复涉及单个呼叫、信元或包重选路由, 绕过失效电路,诸如动态无级选路(DNHR)和 IP 选路均属于此类恢复。传送 层的恢复常常与通道有关,而与业务无关(除非有关通道已经专门分给了某种 业务) 。这种恢复涉及到多个电路、信元或包,影响面大,需要较少的操作, 因而可望较短的时间内恢复更多的业务。以下主要从业务层的恢复和传送层的 恢复两方面进行讨论。 3.2.1 DWDM 层故障恢复技术 DWDM技术的应用虽然极大地增加了通信传输的容量,但是在出现故障时 可能会受到更加严重的损伤。对于目前国内在干线网络升级扩容

14、或建设时大量 使用的32 2. 5 Gbit/ s、8 10 Gbit/ s 或更高速率的DWDM系统,其每对光纤 上承载的业务量是相当高的,一旦出现光纤失效或整条光缆全阻的重大故障以及 节点故障,其后果是不堪设想的,所以必须对DWDM网络的故障恢复技术进行研 究。研究DWDM网络的故障恢复机制不仅可以有效的恢复诸如光缆断裂、光 交叉连接设备瘫痪等大容量失效,而且可以更好地提高服务质量,满足未来变 化的市场要求29,34。 DWDM故障恢复属于传送层恢复,由于DWDM是一个对传送业务透明的 传送网络,也就是说DWDM可以承载现有的ATM、SDH、IP以及未来的其它 多种业务,因此研究DWDM网

15、络的保护与恢复有重要意义。选择网络的故障 恢复方法与网络的拓扑结构密切相关,不同网络的拓扑结构将采取不同的网络 保护和恢复技术。对DWDM传送网故障恢复技术可根据拓扑结构分为三类: 点到点机制(Point-to-Point) 、环网系统(Ring-System)和网状网结构(Mesh 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第18 页页 Architectures)22。 基于点到点(Point-to-Point)的DWDM保护可以分为两种24。 一种是在DWDM中承载的多个波长之间进行保护,例如,对一个 16*2.5Gbit/s的DWDM系统中,可以将其中的某个波长定

16、为保护波长,其余为 工作波长。当某个工作波长由于故障而无法正常工作时,可以将其承载的业务 倒换到备用波长上。但由于保护波长和工作波长都处于同一根光纤中或光缆上, 一旦发生线路故障,将无法实现路径的保护,所以意义并不大。 另一种基于点到点(Point-to-Point)的保护策略是光复用保护 (OMSP,Optical Multiplex Section Protect)这种保护方式是在发送端利用分路 器对光信号进行分离,在接收端得用光开头进行选路。此处需要说明的是,只 有在两条路由相对独立的光缆线路中实现这种方案称为异径方式。这种恢复恢 复方式的最大优点是可以对光缆全断等最严重故障进行有效的恢

17、复,且时间仍 能满足50ms的要求。但缺点是需要不同路由的额外光缆线路,成本较高,而且 具体实现不容易有合适的富余线路资源。 基于点到点的DWDM保护方案只能在同一条光缆内实现对波长的保护,无 法实现高效的光复用段的保护和恢复,而采用环形拓扑结构可以实现较好的保 护和恢复。 (这一点与SDH类似)利用现有的点到点DWDM 终端设备连成环, 即可构成基于点到点的环形网。采用具有光波长分插复用能力的光分插复用设 备(OADM:Optical Add and Drop Multiplexer)组环是DWDM 在环形网中应 用的另一种形式。这两种环形网在形式上十分相似,但实际上有较大差别。基 于OAD

18、M 的DWDM 环形网具有灵活的波长组织能力,不仅可以实现单个光 波长通道级的保护,而且在出现光缆全断的重大故障时,可以在断点两侧的 OADM 节点进行“环回”操作,完成光复用段级的保护。 前面两种恢复方法的着眼点都只是立足于以为单个波长为独立业务承载单 位,而随着以IP为代表的数据业务的飞速发展,DWDM网络正从原来的骨干网 延伸到城域网乃至接入网。可以预见将来会有多个DWDM网络互连、嵌套的 局面,即渐渐形成Mesh网。Mesh网络会带来一系列的新问题,特别是对于基 于全网观点的生存性来说,最大的变化在于原来的DWDM网络保护和恢复的 着眼点都是立足于以单个波长独立业务承载单位的,而在多个

19、DWDM网络构 成的Mesh网络中,无法保证端到端的波长连续性,即所谓的光通道(light path)的连续性。所以如何在这种情况乃至在结构更为复杂的Mesh形DWDM网 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第19 页页 络中实现保护和恢复,是目前研究的重点和难点。使用光交叉连接设备(OXC, Optical Cross-Connect) ,结合动态波长分配算法实现网络的故障恢复是较好的 解决方案之一34 。这种方案的基本思想是:在多个DWDM 网络的汇接点处设 置OXC。OXC 包含了大型的光交叉连接矩阵和光波长变换单元。 DWDM故障恢复的几个优点12,22:

20、(1)故障恢复速度快。光层的保护是对于波长进行操作,保护恢复的基本粒 度是波长,而不是时隙,因此使网络的受保护带宽提高了一个数量级大 大提高了恢复的速度。 (2)恢复成本低,光层恢复较高层恢复少了一些协调性,不需要业务层恢复 所必须的一些附加的管理、控制等功能,极大的降低了成本。 (3)透明性,光层波长路由恢复技术独立于高层的协议。 (4)可靠性高,光层处于光传送网结构的底层,可以避免高层网恢复由于不 清楚物理拓扑结构,而出现工作路由与替代路由的共享光纤链路,造成 保护失效的问题。 DWDM层故障恢复技术的缺点23: (1)DWDM层的故障恢复机制不能解决所有由上层故障所引起的问题。 (2)D

21、WDM层恢复机制的粒度过粗,如果客户需要差分服务则在DWDM层 无法提供这种服务。 (3)DWDM层提供故障恢复机制的资源利用率偏低。 3.2.2 IP 层故障恢复技术 IP层故障恢复技术主要考虑的一个因素就是检测故障的时间。传统的IP恢 复机制是采用IP动态路由方式。动态路由是通过在相邻的路由器之间交换控制 信息来实现的,这里所说的控制信息是指刷新路由器的路由表所需的信息。这 种路由方式可以保证在链路或节点故障时对分组重新选路。该协议保证网络具 有与物理层无关的可生存性。采用的动态路由协议可以动态地发现可连接的处 于工作状态的路由器,使得路由可以对网络的故障自适应36。 故障检测一般有两种实

22、现方式,一种是由本地路由器检测到故障后,利用 路由控制消息协议通知邻近的路由器。另一种故障检测方式是利用某些背景消 息(的计时器的超时来通告故障的出现。路由器得知故障出现后,重新计算有 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第20 页页 受影响的路由, 刷新它的路由表,利用OSPF或BGP协议的Update消息向邻近 路由器通告发生的变化,最终各路由器收敛到统一的路由之上45。动态路由协 议可以有效地利用网络的空闲资源,灵活地对拓扑变化做出反应。但是所需的 恢复时间长,一般为几十秒至几分钟,行为不可预测。为了克服以上缺点,出 现了一些在路由协议基础上进行的改进方法,目

23、前已经提出的缩短恢复时间的 方案有以下几种35,36: 第一种方案为:ECMF(等价多路径转发)的恢复机制。该方案的基本思 想是:由IP源节点发出的IP包经过多条不同路由到达IP目的节点,这样即便是 一条路由上的某一段出现链路或某一个节点发生故障,在恢复时间内仍能部分 IP包可以由正常工作的路径转发。其工作原理如下图所示:当节点A到节点B 的路径Path1上的一段链路失效后,由Path2和Path3这两条路径转发。 图 3-1 ECMF 的恢复机制 ECMF方法不仅有利于负荷均衡,而且一定程度上有利于业务的保护和恢 复。当一条路径上出现节点或链路出现故障时,至少有一部分数据包可以沿着 其它路径

24、继续使用,直到IP路由收敛过程完成,路由器中生成新的路由表。但 这种方法较传统的方法需要更大的设备投资,而且每个路由器需要在转发表中 为同一个目标地址保存多个下一跳表项。 第二种方法:采用分级网络组织结构,为了缩短路由收敛时间OSPF,IS- IS 等分级链路状态路由协议将网络分成多个区域网络结构,将路径计算和路 由更新信息扩散的范围限制在受影响的区域内,使网络具有较好的可扩展性。 第三种方法:减少隐式故障检测时间,在链路状态路由协议中减少 “hello”消息计时器的时限,可更加频繁地发送Hello 消息,从而更加迅速的 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第21

25、页页 发现故障,其代价是控制消息的开销增加。 3.2.3 MPLS 故障恢复技术 基于MPLS 的生存性策略是指快速并完全地重建MPLS网络中受故障影响 的流量。故障可能是由IP 层或者传输IP流量的低层检测到的。通过在分组头 上追加一个标签栈,可以建立一系列标签交换路径(LSP) ,利用LSP 作为保 护路径,可以实现业务的保护或恢复(重路由)30。 重路由定义为在故障发生后根据流量重建的需要来建立新路径或路径段。 新路径建立的依据可能是故障信息、网络路由策略、预定义配置和网络拓扑信 息等。因此,检测到故障后,就通过信令建立能够绕过故障的路径或路径段。 因为检测到故障后需要做的事情比较多,重

26、路由机制比保护切换机制要慢。然 而因为要在故障已经发生并且知道故障的发生点之后才能利用资源,重路由机 制要更简单,更节俭。一旦网络路由算法在故障后聚合,在某些情况下,基于 当前网络状态和网络策略的重路由在重新优化网络方面更具优势。重路由恢复 使用按需建立的路径和按需保留的资源。 保护切换机制则是基于网络路由策略、工作路径流量的重建需求和管理考 虑,在故障发生前预先建立一个保护路径或路径段30。恢复路径可能是也可能 不是与工作路径脱节的链路和节点。然而如果恢复路径与工作路径都承担故障 风险,这个构造的总可靠性就降级了。检测到一个故障时,受保护的流量就转 换到保护路径并重建。保护切换使用预先建立的

27、恢复路径和预保留的资源(如 果恢复路径要求保留资源)31。 3.2.4 SDH 故障恢复技术 SDH和DWDM光网络有着相似的功能,都是面向连接的复用网络。SDH 是基于同步数字复用,而DWDM是基于波长的复用。SDH网络的常用的保护 和恢复技术有自动保护倒换(APS)和自愈环(SHR)22。 自动保护倒换(APS) APS技术典型的被用于链路故障的恢复。它主要包括1+1、1:1方式,这两 种不同之处在于分配不同的保护资源。在1+1的APS方式下,工作通道和保护 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第22 页页 通道上均传送业务流,接收端比较两个信号的质量并接收更好

28、一个信号。1:1 的APS方式下,信号由工作通道传送,当接收信号质量劣质时,信号倒换到保 护通道中传送。此时需要APS信令协助工作通道切换到保护通道22,37。从1:1的 方式可以扩展到M:N的模式,此时N条工作通道共享M条保护通道。 自愈环(SHR) SHR较APS来得更为灵活,可以处理节点和链路故障。在自愈环保护方式 中,主要分为两纤单向通道倒换环(2-fiber UPSR) 、两纤双向路倒换环(2- fiber BLSR)和四纤双向线路倒换环(4-fiber BLSR) 。 SDH 层的优势有: (1)SDH保护是标准化的并且能跨域操作。SDH层提供监测和自动保护交换 两者。 (2)SD

29、H层提供可保护交换通道粒度的更多控制。 SDH层的一些不足之处: (1)备用容量的利用率低。 (2)SDH层不能对高层的故障进行恢复,如SDH不能检测ATM(或MPLS) 层次的故障。 (3)SDH不能区分不同的流量的优先级,不能基于优先权进行切换。 3.2.5 ATM 故障恢复技术 ATM(Asynchronous Transfer Mode)是一种以信元为单位的异步转移模式。 异步意味着来自任何一个用户的信息元流不必是周期性的。在ATM网络中,为 了要在通信双方之间传送业务信息,必须在通信双方之间建立起虚连接。ATM 将虚连接分为两个等级:虚通道(VP)和虚信道(VC) 。VP是具有相同的

30、虚 通道标志(VPI)的信元所占有的子信道,VC是具有相同的虚通道标志 (VCI)的信元所占有的子信道。VP类似于管道,里面包含了一定数量的 VC。38 ATM的故障恢复技术主要在ATM层进行,ATM层的恢复可以分VP和VC 的恢复。ATM中VP的恢复可使得包含的一组VC同时恢复,比逐个VC恢复的 消息和处理开销小,因而已有的研究主要集中在VP层的恢复38。当故障发生 时,如一条链路失效时,通常链路的下游节点将检测到故障,通知被称为发送 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第23 页页 节点的节点。由发送点产生并发送空闲容量查找消息,消息中包括故障链路标记、 受影响

31、的VP标识、受影响的VP的带宽大小等。收到消息的节点将自己的节点 标识和可用空闲量写入消息中,并继续传递该消息。这样当消息最终到达另一 端节点(称为选择点)时,该节点可以根据收到的消息,选取恢复路径,确定 为受故障影响的VP的恢复路径,并发送恢复消息,在恢复路径上的空闲容量 中为各受故障影响的VP分配带宽。最后,在收到发送点发出的应答消息后, 完成受影响的VP从工作路径到恢复路径的切换25。 VP 层的恢复机制目的在于尽快、尽可能多的以 VP 为单位恢复故障连接, 执行过程简单、快速,但是没有考虑不同服务的不同要求,且 VP 的恢复粒度 过大容易导致空闲容量的利用不充分。相比之下,VC 层的恢

32、复优点在于 VC 对应着端到端的服务连接,便于处理各种服务的不同要求,更容易支持优先级 的恢复,灵活性更好,而且 VC 的带宽粒度小,能充分利用空闲资源。 ATM 层恢复技术的优势: (1)ATM 层提供检测路由器或交换机的故障的能力,这对于低层而言是透明 的。 (2)ATM 层能通过计算在 ATM 头部识别的错误来检测节点或软件失误配置, 在 ATM 中,这可通过跟踪 VPI/VCI 的不匹配来实现。 (3)ATM 的 OAM 功能能帮助监测虚拟电路或虚拟路径上的路径错误,并且 能提供比单独靠路由协议更快的检测和恢复。 3.3 故障恢复的层次考虑 上面几节主要介绍了网络中各层的恢复机制与技术

33、,网络各层的恢复技术 各有各的优缺点。通过跨层故障恢复机制的协作能提高网络对故障的响应时间, 对于在设计和管理流量工程机制中更好的优化网络性能也是很有价值的。即使 每一层故障检测机制独立,在受管理和约束的情况下融合各层的故障恢复机制 还是很重要的12,18,19。 高层故障不会被低层检测到的一个例子就是,ATM 或 MPLS 层报文出错 而 SDH 检测不到,而且也必须在高层恢复。相对的,光纤断裂或链路故障是 在高层中不可见的。所以如果能够传递这些跨层的故障信息,可能会使低层, 比如说光层,能从高层的更大规模的保护容量中受益,使得他们比一般情况下 西南交通大学硕士研究生学位论文西南交通大学硕士

34、研究生学位论文 第第24 页页 要快。 多层网络故障恢复的关键在于各个间层网络故障恢复技术的之间的协调以 及对空闲资源的管理和利用,对于这类问题的研究也是最近几年才开始的。 ITU-TSG13 组已将此问题作为 2001-2004 年期间的一个研究课题而开始专门 进行研究,而目前网络的一个研究热点 ASON,其研究内容也包括了多层网络 生存性的问题。2001 年开始提出的 GMPLS(Generalized MPLS)是一个针对 目前的同步光网络(SONET)和同步数字层(SDH)传输基础结构的通用 MPLS 技术。GMPLS 需要对原有的 MPLS 的信令和协议进行一些扩充和修改。 它对故障

35、恢复机制的支持效果更为显著,是多层故障恢复机制的一个较好的构 想。层间生存性策略协调要解决的关键问题就是各层生存性方案之间的互联策 略问题。互联策略通常由这样一些规则组成:它描述了什么时候开始和停止恢 复动作;如协调不同生存性技术的动作顺序等。互联策略包括升级策略 (escalation strategy)和恢复层分配(recovery layer assignment)策略两种。 多层网络的故障恢复技术需要各层都预留有各自的空闲容量,空闲网络容 量的设计问题是多层网络故障恢复技术必须解决的问题之一。目前对多层网络 空闲容量的设计有 3 种方法:传统方法、选择性保护和公共池方法29。 但从实际

36、使用情况来看,真正应用于实际场合的这类技术并不多见,常见 的仍是单层网络的故障恢复技术。随着传送网络向着超高速、智能化、多业务 接入等方向发展,传送网络的灵活性、生存性和可靠性势必会引起越来越多的 重视,而由此引出的多层网络故障恢复问题也会受到来自运营商、科研机构和 设备制造商等多方的关注。 在底层(传送层)的恢复技术中(如 DWDM)可以根据故障源进行简单 的处理,并进行较粗粒度的恢复,在底层所采取的恢复操作数最少,同时在触 发任何恢复操作前,不需要穿过多层对故障进行广播。但任何底层的恢复机制 不能解决所有由上层故障所引起的问题。如此一来,故障发生的源层或它的上 层不得不解决这个问题。 同样

37、,在高层(业务层)的恢复好处在于处理节点或更高层的失效比较容 易,且高层的恢复机制允许根据业务流的重要性来区分对待,这是底层所达不 到的,且因为处理粒度较细,所以资源的利用率更高;缺点是恢复粒度较底层 来得细,所以当底层出故障时,可能需要较多的恢复行为,操作较为复杂。 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第25 页页 第 4 章 SUPANET 的故障恢复 4.1 SUPANET 故障恢复技术分析 4.1.1 SUPANET 故障恢复的必要性 SUPA 利用带外信令控制思想将用户数据传输平台(U 平台)与信控、管理 平台(S&M 平台)相分离,进而将 U 平台简化为

38、单物理层平台,将服务质量保 障机制嵌入平台之中,直接保障用户数据交换的服务质量。在信控、管理平台 支持服务质量协商、最少跳数(hop)的基于服务质量的波长路径选择 (Shortest Path - Lambda QoS Routing, SP-LQR)、呼叫入网控制(CAC)一 系列服务质量保障措施和策略,与用户平台的内嵌的服务质量保障机制,共同 实现单数据流和数据流类服务质量保障1-4。 但是 SUPANET 中的网络资源可能发生故障,为保证 SUPANET 中业务的服务 质量,SUPANET 必须提供从网络故障中快速恢复的机制以提高 SUPANET 的可靠 性和有效性。因此在这种情况下 S

39、UPANET 中提供了基于虚通路故障恢复功能, 以缩短故障恢复时间,从而提高 SUPANET 可靠性和有效性以保证业务流的服务 质量,而且较 DWDM 层可以提供更细的保护粒度,为不同的业务流提供不同的 故障恢复方法。因为 SUPA 是面向连接的,所以当虚通路中的交换节点或虚线 路出现故障时而导致此虚通路失效时,我们可以将业务流转移到另外一条额外 虚通路继续传输。这条额外的虚通路可以是在故障发生之前就建立好的,同样 也可以是故障发生之后再建立的,这取决于业务流的服务质量要求。 4.1.2 SUPANET 故障恢复思想概述 在一般情况下,当虚通路中的虚线路或交换节点因某种原因出现故障时导 致此虚

40、通路失效时,可以通过信令重新建立一条新虚通路以绕过故障。而新虚 通路的建立过程需要一定的时间,因此在这一过程中可能会有较多的数据丢失, 虽然这对于一般的数据流来说这些数据的丢失是可以忍受的,但是对于服务质 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第26 页页 量要求高的业务如语音、视频以及一些传统应用将产生较大的影响。而且也存 在无法找到一条新的有效路径的可能性。 图 4-1 虚通路失效的重协商 图 4-1 表示的是在 SUPANET 中因某些故障而出现虚线路失效之后的重协 商过程。图中实线表示原本的虚通路,虚线表示故障的上游交换节点(本文中 无特殊说明的交换节点均为一

41、般的 EPFTS 交换节点,可能为中间交换节点也 可能为边界交换节点,如是边界交换节点会特殊说明为边界交换节点)发起建 立绕过故障的新虚通路。在这种方法中,当故障的上游交换节点发现故障时, 它会启用服务质量协商协议重新协商一条虚通路以绕过发生故障的节点或虚线 路。这一协商过程需要耗费一定的时间。 另外一种方法是通过将故障信息通知到入口处的边界交换节点,由入口边 界交换节点重新发起信令建立一条新的虚通路(这一过程中涉及进行原有虚通 路的拆除,和资源的回收等操作) 。同样此方法也要耗费大量的时间去重新建 立一条新的虚通路。从上面分析可以看出,上述的两种方法存在一个共同的缺 点就是都需要耗费较多的时

42、间用于虚通路重新建立,因此会对服务质量要求较 高的业务流产生较大的影响。 以上的方法可以为服务质量要求一般的业务流提供故障恢复,但不能满足 服务质量要求极高的业务流。针对 SUPANET 中服务质量要求较高的业务流, 我们对 SUPANET 中的虚通路的故障恢复采用保护切换的方法。保护切换是一 种可以在短时间内恢复因故障而导致失效的虚通路的方法。在保护切换方法里, 我们将受保护的原虚通路称为主虚通路,为主虚通路提供保护而额外建立的虚 通路称为备份虚通路。备份虚通路与主虚通路的入口结合处的共同交换节点称 为入口节点,出口结合处的共同交换节点称为出口节点。 保护的基本思想是:为主虚通路预先建立一条

43、备份虚通路,当主虚通路中 出现故障而导致主虚通路失效时,数据在切换点处将数据切换到备份虚通路上 进行传输。 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第27 页页 图 4-2 虚通路保护基本思想 在图 4-2 中,主虚通路为 1-2-3-4,1-5-6-4 是主虚通路的备份虚通路。交 换节点 1 为入口节点,交换节点 4 为出口节点。在图 4-2 中,数据沿着主虚通 路进行传输。备份虚通路随时做好准备接替主虚通路工作。在主虚通路工作时, 备份虚通路并不承载数据。一旦主虚通路上发生故障,并且故障信息报告给入 口节点时,数据迅速的被切换到备份虚通路上继续传输。在图中的这个例子

44、入 口节点是边界交换节点,实际的应用中入口节点可能是虚通路中的其它交换节 点。这就允许网络中一些容易发生故障的网络资源得到保护,而虚通路所经过 的相对比较健壮的部分就没必要分配过多的备份资源,而且可以缩短故障通知 的距离,从而也就缩短了故障恢复的时间。 图 4-3 节点保护 在图 4-3 中,入口节点是中间节点并不是边界交换节点。主虚通路为 2-3- 4,备份虚通路 2-5-6-4 为主虚通路提供保护。与图 4-2 不同的是,图 4-2 提供 了端到端的虚通路保护,而图 4-3 只提供了单个节点的保护。 因为备份虚通路是在故障发生之前预先建立的,所以无需在故障发生后通 过信令建立。这大大减少了

45、故障恢复的时间,因此大大降低了故障恢复过程中 数据包的丢失。采用切换保护方法,可以实现对虚通路上的故障做出快速反应 及时切换,保证了业务流的平滑过渡,不会导致业务中断。因为备份虚通路是 用于临时代替主虚通路之用的,所以主虚通路的边界节点会寻找新的节点来尝 试重新建立新的虚通路,并将业务流切换到新的虚通路上,在新通路建立以前, 业务会一直在备份虚通路上进行转发。 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第28 页页 4.1.3 SUPANET 保护切换方法的分类 根据 SUPANET 中对网络资源保护的范围的不同,可以分为路径保护和局部 保护。 路径保护:为虚通路中的多个

46、交换节点或虚线路建立备份虚通路进行保护。 路径保护有时可能是端到端的保护,当备份虚通路的入口交换节点为入口 边界交换节点,出口节点为出口边界交换节点时候即为端到端的保护,如图 3- 2 所示,为主虚通路提供了端到端的保护。备份虚通路应沿着与主虚通路尽可 能不同的路径建立。这样可以确保不会出现某一节点出现故障同时影响到主虚 通路和备份虚通路。 局部保护:备份的虚通路从受保护的虚线路或 EPFTS 交换节点的附近通过。 为单独的节点或虚线路建立备份虚通路从而进行保护。局部保护根据所保护的 对象,可分为对虚线路的保护和对 EPFTS 交换节点的保护。 虚线路的保护:针对容易出现故障的虚线路,建立一条

47、绕过此虚线路的备 份虚通路。即从受保护的虚线路的上游节点到下游节点之间额外建立一条备份 的虚通路。一旦虚线路失效,上游节点就将业务流从原虚通路上切换到备份虚 通路上,数据经过一个微小的中断后继续传输。虚线路的保护只适用于两个交 换节点之间的虚线路发生故障时的情况,并不适用于交换节点可能出现的故障。 图 4-4 虚线路保护 图 4-4 表示了一个为保护交换节点 2 到交换节点 3 之间的虚线路而建立起 的一条备份虚通路的情况。当受保护的虚线路(2-3 之间的虚线路)失效后, 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第29 页页 原本通过此虚线路的业务流就会被切换到备份虚通

48、路(2-5-6-3)上,继续传 输。 节点保护:虚线路保护只适用于两个交换节点之间的虚线路失效时的状况, 由于交换节点也可能出现故障,因此需要对交换节点进行保护。要实现节点保 护,需要建立从受保护节点的上游节点到受保护节点的下游节点之间的备份虚 通路,且备份虚通路不经过受保护的节点。如果受保护的节点出现故障,可以 将业务流切换到备份虚通路上继续传输。 如图 4-3 表示从节点 2 到节点 4 的备份虚通路(2-5-6-4) ,为节点 3 提供 保护。一旦交换节点 3 出现故障,当节点 2 检测到这一故障后,便将业务流切 换到备份虚通路(2-5-6-4)上继续传输。从 3-3 图中我们,可以明显

49、看出备 份虚通路不仅可以为节点 3 提供保护,可以为相关的 2-3 之间和 3-4 之间的虚 线路提供保护。 从上面的分析,我们可以得出一个结论就是可以利用局部保护技术对 SUPANET 中的任何薄弱环节进行保护,使网络变得更加健壮。如果要为某一虚 通路提供端到端的保护,我们可以采用路径的保护方式也可以采用对虚通路上 的每个节点提供节点保护来实现。 如图 4-2 表示了为主虚通路(1-2-3-4)通过备份虚通路(1-5-6-4) ,提 供了端到端的保护。 图 4-5 局部保护实现端到端保护 西南交通大学硕士研究生学位论文西南交通大学硕士研究生学位论文 第第30 页页 图 4-5 表示通过对主虚通上的各个节点和虚线路进行局部保护而实现对主 虚通端到端的保护。主虚通路 1-2-3-4 由两条独立的备

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1