+ -
当前位置:首页 → 问答吧 → 寻求同城异地容灾备份方法

寻求同城异地容灾备份方法

时间:2009-04-22

来源:互联网

本单位目前应用系统现状:IBM55A 2台、Ds4700 1台、B16 2台、3582带库 aix5.3系统、ORACLE9i数据库、TSM备份软件组成双机热备为应用系统服务;计划在2.5公里外新建一个容灾机房,主要作用是数据备份,要求完全同步发生事故不能损失任何数据。由于本人水平有限请各位高手指教,我大概了解了一下目前知道有以下几种方法:
   1、通过Oracle的Data guard 实现;
   2、通过存储上部署增强远程镜像(Enhanced Remote Mirror)系统实现;
  3、通过HACMP/XD(HAGEO)软件实现;
不知道都是怎么实现的,有什么利弊请各位高手指教,谢了!

作者: jtport   发布时间: 2009-04-22

贴1段
容灾中IT技术的选择
我们在做容灾系统方案设计时,根据不同的业务,不同的RTO\RPO需求,应当制定不同的业务连续性计划,根据不同的业务连续性计划选择不同的技术来实现相应的计划。            
我们知道按照《规定》的规定容灾分为数据级的容灾与业务级的容灾。
数据级别容灾的关注点在于数据,即灾难发生后可以确保用户原有的数据不会丢失或者遭到破坏。数据级容灾较为基础,其中,较低级别的数据容灾方案仅需利用磁带库和管理软件就能实现数据异地备份,达到容灾的功效;而较高级的数据容灾方案则是依靠数据复制工具, 例如卷复制软件,或者存储系统的硬件控制器,实现数据的远程复制。数据级别容灾是保障数据可用的最后底线,当数据丢失时能够保证应用系统可以重新得到所有 数据。从这种意义上讲,数据备份属于该级别容灾,用户把重要的数据存放在磁带上,如果考虑到高级别的安全性还可以把磁带运送到远距离的地方保存,当灾难发 生后,从磁带中获取数据。该级别灾难恢复时间较长,仍然存在风险,尽管用户原有数据没有丢失,但是应用会被中断,用户业务也被迫停止。
应用级容灾是在数据级容灾的基础上,再把应用处理能力复制一份,也就是说,在备份站点同样构建一套应用系统。应用级容灾系统能提供不间断的应用服务,让用户应用的服务请求能够透明地继续运行,而感受不到灾难的发生,保证信息系统提供的服务完整、可靠、安全。一般来说,应用级容灾系统需要通过更多软件来实现,它可以使企业的多种应用在灾难发生时进行快速切换,确保业务的连续性。
灾难恢复过程中,通常分为本地与远程二个部分,通过以下技术(或层次)来实现:

        灾难备份恢复技术
灾难备份恢复是指将数据从企业数据中心移动到另一个地点,以便最终恢复。可以使用磁带备份的异地存储,或者数据中心到另一地点的数据复制实现。这种技术的实现通常借助企业备份子系统,包括备份软件与硬件:物理带库或虚拟带库等。当前市场主流的备份软件有symantec|veritas netbackup、emc|legato netwoerker等。
        本地高可用性技术
指的是将一个或者多个数据系统故障转移至同一站点里立即可用的硬件资源上。例如,如果某个数据服务器发生了故障,你可以立即让同一数据中心里的另一台物理机器投入在线工作。这种技术的实现通常借助系统的高可用软件,市场主流的高可用软件有IBM HACMP,HP MC-SG,symantec|veritas VCS等。
        远程集群技术
远程集群技术把高可用性推向了一个更高的级别,它指的是在物理地点之间进行的数据系统故障转移。这种技术的实现通常借助高可用软件的远程模式,市场上支持远程集群技术的高可用软件有IBM HACMP(HACMP-XD),Symantec|veritas VCS(global选项)
这种类型的解决方案比其他任何形式的恢复技术(在速度上)快很多。
        远程数据复制技术
  通常数据复制地工作机制主要包括同步和异步两种。同步远程镜像(同步复制技术)是指通过远程镜像软件,将本地数据以完全同步的方式复制到异地,每一本地的I/O事务均需等待远程复制的完成确认信息,方予以释放。异步远程镜像(异步复制技术)保证在更新远程存储视图前完成向本地存储系统的基本I/O操作,而由本地存储系统提供给请求镜像主机的I/O操作完成确认信息,远程的数据复制以后台同步的方式进行。通常由于链路的延迟与衰减,(关于链路的延迟与衰减,请参考附件1)我们通常把同步方式称作同城复制,把异步方式称作异地复制。
同步模式与异步模式的对比:
同步模式远程复制:
优点:无数据丢失,业务恢复时间极短;
缺点:1:由于链路延时与衰减的原因,有距离限制(通常不能超过200KM);
2:由于1笔IO写入必须主站点与灾备站点全部完成以后才算成功,所以对生产应用系统有性能影响;
3:对链路的要求很高,成本较高。
异步远程复制的总结:
优点:业务恢复时间极短,无距离限制,链路成本相对较低;
缺点:有少量数据丢失;

数据的远程复制技术根据作用层次的不同主要分为3类:
1.基于存储层面数据复制: 主流产品:EMC SYMMTRIX SRDF、EMC CLARIION MIRRORVIEW、IBM PPRC、HDS TrueCopy等等
2.基于主机层面数据复制:主流产品:Veritas Volume Replicator(卷远程复制)、veritas Storage Foundation(卷远程镜像) ibm glvm(卷镜像)等
3.基于应用层面数据复制:Oracle DataGuard,IBM DB2 HADR等

        基于存储子系统的远程复制:
采用基于存储的容灾方案的技术核心是利用存储阵列自身的盘阵对盘阵的数据块复制技术实现对生产数据的远程拷贝,从而实现生产数据的灾难保护。在主数据中心发生灾难时,可以利用灾备中心的数据在灾备中心建立运营支撑环境,为业务继续运营提供IT支持。同时,也可以利用灾备中心的数据恢复主数据中心的业务系统,从而能够让企业的业务运营快速回复到灾难发生前的正常运营状态。
基于存储的容灾方案示意图如下:[img][/img]

基于存储数据复制技术的容灾方案示意图

同步方式:(同城)

异步方式:(异地)

同步与异步结合:(通常称作2地3中心甚至3地)

采用基于存储数据复制技术建设容灾方案的主要缺点是:
通常必须采用同一厂家的存储平台,通常也必须是同一系列的存储产品,给用户的存储平台选择带来一定的限制。
采用同步方式可能对生产系统性能产生影响,而且对通信链路要求较高,有距离限制,通常在近距离范围内实现(同城容灾或园区容灾方案)
采用异步方式与其他种类的异步容灾方案一样,存在数据丢失的风险,通常在远距离通信链路带宽有限的情况下实施。
灾备中心的数据仅用来做保护,通常不可用。
尽管有以上缺点,基于存储的容灾技术方案仍然是当前企业最优先选择的容灾技术平台
        基于主机层面的的镜像或远程数据复制技术:
    采用基于主机的容灾方案的示意图如下:

基于主机的容灾方案示意图

采用基于主机系统的容灾方式的核心是利用主、备中心主机系统通过IP网络建立数据传输通道,通过主机数据管理软件实现数据的镜像或远程复制,当主数据中心的数据遭到破坏时,可以随时从备份中心恢复应用或从备份中心恢复数据,从而给企业提供了应用系统容灾的能力。
采用基于主机的数据镜像或复制技术建设容灾方案有以下优点:
1基于主机的方案最主要的优点是只对服务器平台和主机软件有要求,完全不依赖于底层存储平台,生产数据中心和后备数据中心可以采用不同的存储平台;
2既有针对数据库的容灾保护方案,也有针对文件系统的容灾保护方案。
有很多不同的基于主机的方案,可以满足用户的不同数据保护要求,提供多种不同数据保护模式;
3基于IP网络,没有距离限制

同时,采用主机的数据复制技术建设容灾方案有以下缺点:
1基于主机的数据复制方案由于生产主机既要处理生产请求,又要处理远程数据复制,必须消耗生产主机的计算资源,因而对生产主机性能产生较大的影响,甚至是产生严重影响。
2灾备中心的数据一般不可用,如果用户需要在远程数据中心使用生产数据给开发测试、DW/BI应用使用将非常困难。
3管理复杂,需要大量的人工干预过程,容易发生错误。
        基于应用层面的远程复制技术:(我们以oracle data guard为例,其他数据库的远程复制技术原理相同)
Oracle Data Guard技术是Oracle数据库系统特有的灾难备份和恢复技术,利用了Oracle数据库系统的日志备份和恢复机制。Data Guard的基本原理是在与主系统完全一致的硬件和操作系统平台上建立后备数据库系统,同时对主数据库的数据库日志(Log)和控制文件等关键文件进行备份。
在主系统正常工作的同时将主系统产生归档日志文件(Archived Log)不断的传送到后备数据库系统,并且利用这些日志文件在后备数据库系统上连续进行恢复(Recover)操作,以保持后备系统与运行系统的一致。当主系统发生故障时,使用备份的数据库日志文件在后备数据库上恢复主数据库内的数据。

采用Oracle Data Guard的容灾方案
采用Oracle 9i Data Guard技术进行灾难备份需要满足以下前提条件:
后备系统与主系统的硬件平台、操作系统、操作系统版本等保持一致;
后备系统与主系统上Oracle用户的权限一致;
后备系统与主系统的Oracle数据库版本一致;
后备系统与主系统的Oracle数据库配置文件一致。

采用Oracle Data Guard建设容灾方案有以下优点:
完全通过Oracle数据库机制来实现,完全不依赖于其它软件和底层存储平台;
可以满足用户的不同性能、数据保护要求,提供多种不同数据保护模式;
可以实现一对多的数据复制,提供多重保护;
后备数据库可以在很短的时间内提升到生产状态(因为数据库已经在运行)
基于IP网络,没有距离限制

同时,采用Oracle Data Guard建设容灾方案有以下缺点:
Oracle Data Guard的三种模式都将对生产数据库系统的性能产生影响,因而需要更多的处理资源;
后备数据库不可用,如果用户需要在远程数据中心使用生产数据给开发测试、DW/BI应用使用将非常困难。
只能对Oracle数据库数据提供保护,不能对其它应用数据—如文件应用等提供灾难保护。
管理复杂,需要大量的人工干预过程,容易发生错误。
只能保护Oracle数据库,无法保护其他应用数据。
因此,采用Oracle Data Guard构建容灾方案在只需要保护数据库数据环境下可以考虑采用,但在关键的业务系统中很少使用。


容灾IT实现技术总结:

作者: 笑看风云淡   发布时间: 2009-04-22

我写的这个文档中由于公司原因,对于CDP一笔带过,请谅解。

作者: 笑看风云淡   发布时间: 2009-04-22

如果只要求不损失数据,那就拉2条光纤到容灾机房,买2个b16,一个ds4700,1台主机,最便宜的方法 lvm mirror

作者: leon103   发布时间: 2009-04-22

如果只要求不损失数据,那就拉2条光纤到容灾机房,买2个b16,一个ds4700,1台主机,最便宜的方法 lvm mirror
leon103 发表于 2009-4-22 16:12

LVM MIRROR做不到RTO=0与RPO=0的LZ的需求

作者: 笑看风云淡   发布时间: 2009-04-22

想看我这文章的全部,请消息我

作者: 笑看风云淡   发布时间: 2009-04-22

关注中。。。。。。。。。。。。

作者: zhanghaiyang   发布时间: 2009-04-22

1,如果中间走的的LAN的话,可以考虑只加一个存储直接用AIX的LVM做镜像,可以做到实时同步,且不会丢数据,几乎不影响性能,但只是实现数据的备份和实时,不是完全意义上的容灾。如果想实现自动接管那就再加个主机,三个节点做HACMP。而且这个方式省了remote mirror的license的费用,这个可不低呀,而且这个更适合。
2,如果中间走的是WAN的话,又要实现实时的同步,这个就要看你对性能的要求了。

作者: xyk1314520   发布时间: 2009-04-22

2.5KM不远,可以在两边租电信的光纤,用光纤来做存储级的同步.这样的性能应该不错.

作者: hnroger   发布时间: 2009-04-22

DS4700这种档次的存储做存储复制容灾,没经验,呵呵。

作者: wolfop   发布时间: 2009-04-23

学习一下,支持

作者: chesterocm   发布时间: 2009-04-23

6# 笑看风云淡

怎么消息啊,风云老大 发我邮箱吧[email protected] 看了这个想了解下这些和CDP又有什么区别。

作者: skyping   发布时间: 2009-04-23

学习一下,支持

作者: badman   发布时间: 2009-04-23

风云老大 我已经消息你了 还没有你的消息

作者: skyping   发布时间: 2009-04-23

我写的这个文档中由于公司原因,对于CDP一笔带过,请谅解。
笑看风云淡 发表于 2009-4-22 15:24


谢谢老大由于这两天出门没在,所以才看见,想了解一下具体的希望老大指教!高度感谢!

作者: jtport   发布时间: 2009-04-24

1,如果中间走的的LAN的话,可以考虑只加一个存储直接用AIX的LVM做镜像,可以做到实时同步,且不会丢数据,几乎不影响性能,但只是实现数据的备份和实时,不是完全意义上的容灾。如果想实现自动接管那就再加个主机, ...
xyk1314520 发表于 2009-4-22 23:17

谢谢,我们现状是裸光纤直通的,带宽不是问题,能具体的说一下吗?

作者: jtport   发布时间: 2009-04-24

如果只要求不损失数据,那就拉2条光纤到容灾机房,买2个b16,一个ds4700,1台主机,最便宜的方法 lvm mirror
leon103 发表于 2009-4-22 16:12

谢谢,光纤我们是现成的,设备是不是应该和现有都是一样的呀?

作者: jtport   发布时间: 2009-04-24

DS4700这种档次的存储做存储复制容灾,没经验,呵呵。
wolfop 发表于 2009-4-23 02:36

我好像也看见过好像说DS4700做存储复制容灾档次有点低,是这样吗?

作者: jtport   发布时间: 2009-04-24

晕,,才看见。。2.5KM。。。

作者: 笑看风云淡   发布时间: 2009-04-24

谢谢,光纤我们是现成的,设备是不是应该和现有都是一样的呀?
jtport 发表于 2009-4-24 09:34

设备不一定要一样,比生产档次低些没问题。

作者: 笑看风云淡   发布时间: 2009-04-24

作者: 笑看风云淡   发布时间: 2009-04-24

选择什么技术,完全是由RPO与RTO的要求决定

作者: 笑看风云淡   发布时间: 2009-04-24

选择什么技术,完全是由RPO与RTO的要求决定
笑看风云淡 发表于 2009-4-24 10:19

谢谢老大,RPO=0,RTO=0,全部是数据库,我们的应用系统是客户端登录数据库,在小机上没有安装程序,只有数据库,请帮忙指教一二,我已经消息你了不知能否发一个小弟学习学习!深度感谢!

作者: jtport   发布时间: 2009-04-24

既然你不用考虑带宽的问题,如果你只想保证数据的实时,那就加个存储,不用同型号的,用LVM。
如果你想提高业务的连续性,那就再加个小机到HA里。

作者: xyk1314520   发布时间: 2009-04-24

22# 笑看风云淡
风云老大,我还等着你的全文勒

作者: skyping   发布时间: 2009-04-25

这种情况,直接用HA就可以实现了,连XD option都不需要。
俩存储,LVM镜像。

作者: 老农   发布时间: 2009-04-25

这种情况,直接用HA就可以实现了,连XD option都不需要。
俩存储,LVM镜像。
老农 发表于 2009-4-25 23:59


谢谢农哥指点
老大的意思是用HA做个集群?
或者加个存储用lvm镜像?(不知道DS4700档次是不是有点低呀)

这样对应用系统的速度影响如何?

作者: jtport   发布时间: 2009-04-26

不是或者,是必须同时用。用DS4700没问题。基本上不影响性能,因为就和本地LVM镜像一样。

作者: 老农   发布时间: 2009-04-26

这么好的硬件基础,怎么做都可以啦。

作者: dengxidengxi   发布时间: 2009-04-27

rto等于零,实现不了吧

作者: lichx123   发布时间: 2009-04-27

作者: kuiwei88   发布时间: 2009-04-27

根据各位朋友的建议,从经济使用的角度,计划这样实施不知道可行否现发上来请大家指教一二。
增加设备:55A一台、B16一台、DS4700一台,利用ORACLE的DATAGUARD实现,使数据无丢失。
问题:实施需注意什么?
      对小机的运行速度有多大影响?
      如果想替代主机房运行生产系统需要怎么做?
      RTO是不是就要长些了?大概正常情况需多长时间?

作者: jtport   发布时间: 2009-04-27

我们公司是国内为数不多的专业容灾备份的专业厂家 请联系QQ124754313 金融 电信 电力 公安等众多客户 自己独立产权的容灾备份恢复软件

作者: tsx81428   发布时间: 2009-04-29

杭州美创科技 容灾来自专业 哈哈做个小广告

作者: tsx81428   发布时间: 2009-04-29

基于存储底层的同步复制容灾方式,实施起来比较方便

作者: neo   发布时间: 2009-04-29

我们公司是国内为数不多的专业容灾备份的专业厂家 请联系QQ124754313 金融 电信 电力 公安等众多客户 自己独立产权的容灾备份恢复软件
tsx81428 发表于 2009-4-29 16:03


谢谢,能给点建议吗?

作者: jtport   发布时间: 2009-04-29