一种异地灾难恢复系统的设计与实现.doc

上传人:吴起龙 文档编号:1592145 上传时间:2018-12-26 格式:DOC 页数:8 大小:17.75KB
返回 下载 相关 举报
一种异地灾难恢复系统的设计与实现.doc_第1页
第1页 / 共8页
一种异地灾难恢复系统的设计与实现.doc_第2页
第2页 / 共8页
一种异地灾难恢复系统的设计与实现.doc_第3页
第3页 / 共8页
亲,该文档总共8页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《一种异地灾难恢复系统的设计与实现.doc》由会员分享,可在线阅读,更多相关《一种异地灾难恢复系统的设计与实现.doc(8页珍藏版)》请在三一文库上搜索。

1、一种异地灾难恢复系统的设计与实现随着信息技术在通信、金融、军事等各个领域的广泛应用,计算机数据资料已成为企业开展业务的基础,其重要性不言而喻1。数据的丢失或损坏带来的灾难将是无法估量的。因此各类企业对灾难恢复有着很高的要求2。特别是在商业环境中,随着竞争形势日益严峻,企业对业务的连续性提出了很高的要求,要求企业能在发生灾难性事件时能及时恢复业务并保障业务的连续运行3。制订完备的容灾方案和有效的灾难恢复策略对减少损失有着重大意义。但是,现有的数据备份恢复系统,如EMC的Symmetrix RemoteData Facility、IBM的eXtended RemoteCopy、 Veritas V

2、olume Replicator等,是面向大型用户的软硬件结合的解决方案,其价格昂贵,并在通用性、灵活性等方面存在一些问题。本文提出的灾难恢复系统,面对当前许多中小企业和部门缺乏数据保护的现状,采用B/S结构,不依赖任何特定的硬件及第三方软件,可以用于任何格式的数据恢复,具有很高的可用性和灾难恢复能力,具有性价比高、易操作、稳定性好等特点。 1系统的总体架构 整个恢复系统的设计分为四大部分,即本地服务器、本地网关、远程网关和远程服务器。图1是该系统的拓扑结构。 本地服务器和本地网关构成本地系统,其间由高速内部网络连接;远程服务器和远程网关构成远程系统,其间也由高速内部网络连接。本地、远程系统通

3、过防火墙连接到Internet。 系统采用一种对称式结构。本地服务器与远程服务器没有主、从之分,本地服务器和远程服务器在同一时间运行相同的服务4。当本地服务器发生故障或遭受灾难而失效时,由远程服务器自动接替5其工作,充当本地服务器的角色,对客户端提供服务,并可在未来需要时实现应用的切换,即由恢复后的本地系统继续提供服务,此过程对用户透明。 2具体实现 2.1恢复模型 灾难恢复模型如图2所示,共包括六个环节。灾难监测(disaster inpsect,DI)是灾难恢复的基础。它将监测到的任何灾难信息,包括本地系统和远程系统的设备运行状态、网络连通状况、有效数据源等告知系统管理者;系统管理者在此基

4、础上,作出灾情评估(disaster assessment,DA),并参考以前的灾难恢复决策(disaster recovery strategy,DRS),设计出新的DRS。DRS提供服务中断后快速有效地恢复方式6,并保证系统在发生灾难时不间断地运行7。DI将直接影响DA和DRS的制订。系统管理者在综合考虑恢复代价、安全性及允许花费的时间等因素后,选择一种适宜的恢复策略,进行灾难恢复控制(disaster recovery control, DRC)。在此过程中,系统对恢复的进程和系统的状态等信息进行监控并告知系统管理者。若有需要可随灾难恢复情况及时变更DRS和DRC。 整个过程以系统管理为

5、中心,由系统管理者进行灾难恢复的统一指挥和调度。迅速对灾难进行恢复的关键在于DRS的选择和DRC的效率。 2.2恢复流程 根据灾难监测模块获取到的故障原因和灾难发生点,系统会针对不同的灾难状况,采用不同的恢复流程。其中对远程服务器的故障,采取重新镜像即可,因此需要恢复的灾难状况共有七种情况,除本地系统和远程系统完全故障的情况需要管理员选择一个相对可用的恢复数据源外,其余情况均可得到自动快速的恢复。此处以本地网关和本地服务器同时发生故障为例,介绍系统恢复时的数据流向,如图3所示。图中单线箭头表示系统正常镜像的数据流方向,双线箭头表示系统恢复时的数据流方向。 a)由恢复控制程序完成将远程网关上设备

6、RGDP的数据恢复到本地网关设备LGDP上。 b)将本地网关上设备LGDP重新映像到本地服务器上,记做LSMP。 c)在本地服务器上,将需要恢复的设备LSDP与映像设备LSMP组成镜像磁盘对,将数据流从LSMP导向LSDP,重建数据。重建完成后,本地服务器的设备LSDP即为有效数据。 恢复完成后,由系统管理员通过Web管理工具重新启动系统镜像。 2.3系统模块结构 恢复系统模块结构如图4所示,包括Web恢复管理模块、后台恢复控制模块和磁盘一致性检测模块。各模块间以指令驱动的方式进行通信。 Web恢复管理为用户和系统管理者提供友好的图形化界面,方便、直观地实现对恢复任务的选择和监控。用户通过We

7、b界面选择数据恢复的方式和策略以及监控恢复进度。 恢复控制在后台进行,由恢复程序负责恢复任务的具体执行,这是恢复系统的核心部分。Web通信接口通过发送恢复命令的方式与恢复程序通信;恢复程序接收并解析命令,完成恢复任务的运行、监控、停止或删除。此外,还对系统状态进行分析并更新恢复进度,将恢复的进度和状态信息通过通信接口传递给Web管理模块。 恢复程序向Web恢复管理提供全恢复、快速恢复、定时恢复及中止恢复任务的接口。管理员可以根据需要选择进行不同程度的恢复。全恢复将恢复数据的全集全部通过网络传递到相应网关。此种方式不进行数据的一致性检测,因此操作所需的时间较长。快速恢复仅将更新的数据通过网络传递

8、到相应的网关。此种方式可以减少恢复时间和恢复时的网络流量。定时恢复提供指定数据恢复开始时间的功能,系统恢复将在管理员指定的时间以其指定的方式自动开始。无论何种方式和程度的恢复,管理员都可以对恢复的过程进行人工干预,随时中止恢复过程。 恢复完成后,用户可选择进行磁盘的一致性检测,以进一步确认恢复完成后本地系统和远程系统的数据一致性。 2.4恢复控制 DTCn=(Rn,Pn,Sn,Wn)。其中:Rn为本地网关的任务磁盘分区;Pn为远程网关的任务磁盘分区;Sn为恢复策略;Wn为采用的恢复方式。Rn、Pn、 Sn和Wn在同一个恢复任务中确定并对应,其关系为RnSnWnPn。 对每个任务控制DTCn ,

9、获取相应Sn和Wn后,控制程序将首先进行命令解析,确定用户提交的恢复方式。由初始化模块负责磁盘信息的获取,并由服务端与客户端进行协商,比较Rn和Pn的大小。若用户选择的是快速恢复,则进行Rn和Pn各自的MD5散列值计算。具体做法为:将磁盘分为m段,每段的大小由用户指定。Rn和Pn的第u段的MD5值分别记为mdu和mdu。将每段分为n块,第n块的数据量以datan表示。以块为单位计算该段的MD5散列值:mdn=0,n=0;mdn=md(datan,md(n-1),n0。 mdn即为该段的MD5散列值。将Rn和Pn的段MD5散列值进行比较。若mdumdu 则比较mdu+1和mdu+1 ,若mdu

10、mdu则建立socket连接,进行数据传送。数据传送每次按固定单位进行。若服务器端收到的数据量小于该固定值,则通知客户端重发,即由出错重发机制保证传送数据的正确性。传输方向由Web管理界面进行控制,恢复程序从由Web管理界面写入的配置文件中读取相应标志,确定恢复的方向。若用户选择了定时恢复功能,还需要从时间配置文件中读取相应的时间标志。 3恢复系统性能分析 在实验室内部网环境下搭建恢复系统环境。实验中,本地系统和远程系统均为1.70 GHz处理器。128 MB RAM、7 200转/s硬盘、100 Mbps网卡。由于远程服务器仅用于对外服务切换,其上发生的故障对数据的完整性和安全性没有影响,影

11、响的只是业务的可用性和连续性。远程服务器发生故障时,重新镜像将更有效率8,此种情况不采取对系统进行恢复的方式。此处仅对本地服务器、本地网关、远程网关的故障进行恢复测试。表1列出了四种灾难情况的恢复结果。 从表1可以看出,灾难发生点不同,系统恢复时间也有相应的差别。原因在于各灾难情况的恢复流程不同。如图3所示,本地网关和本地服务器同时发生灾难时,恢复分三个阶段进行;若只是本地服务器的LSDP发生灾难,恢复仅分两个阶段完成从本地网关到本地服务器的恢复。 此外,影响系统恢复时间的因素还有所选择的恢复方式。图5以从远程网关到本地网关的数据恢复为例,显示了选择全恢复与快速恢复两种恢复方式在系统恢复时间上的差异。 从图5可以看出,快速恢复具有更高的效率,并且需要恢复的数据量越大,其时间优势越明显。 对以上系统恢复后进行的数据一致性检测表明,系统丢失的数据量为0。因此可得出该系统具有极好的恢复时间指标RTO9和快速恢复能力,可以在较短的时间内快速恢复系统关键数据。 4结束语 本文设计并实现的异地灾难恢复系统在较低档次的平台上为用户搭建较高等级的远程灾难恢复系统,实现了灾难发生后系统的快速恢复,并保证了恢复后本地系统与远程系统间数据的一致性。用户可通过友好的界面进行灾难恢复的控制。整个系统具有很高的性价比。此系统对于研制具有自主知识产权的恢复技术及其相关产品具有积极意义。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1