IBM异地容灾方案概述
数据容灾与我们常见的数据备份是两个不完全等同的概念。在数据容灾中很常采用,也是很有效的方案是异地容灾。这种容灾方案最有保障,因为它是把数据备份保存在另一地方,甚至另一个国家,这样数据就会更安全。试想一下在伊拉克这样连成战争不断的国家,即使把数据保存在了本国其它地方也是不安全的,所以有许多数据存储厂商提出了全球容灾的方案。从本篇起要向大家介绍几个典型的数据存储厂商的异地容灾方案,本篇所介绍的是全球为著名的数据存储厂商——IBM的几种异地容灾方案。
针对不同的用户需求,IBM公司的异地容灾方案产品线非常丰富,各种数据备份技术和应用方案层出不穷,处于全球领先地位。它的这些容灾方案不可能全在本文中介绍清楚,所以只选三个常见的方案类型向大家介绍。
一、数据级灾备——PPRC
IBM的PPRC(Peer to Peer Remote Copy,点对占点远程复制)复制技术是基于ESS企业级数据存储服务器,通过ESCON(Enterprise Systems Connection,企业管理系统连接,是一种光纤通道)通道建立配对的逻辑卷容灾技术。这是IBM的高级别容灾方案,主要适用于大、中型和电信企业选用。它的网络结构(如下图所示)。
在图中数据中心A和数据中心B可以是两相隔上百公里的网络系统,既可以单独把某个数据中心的数据备份到另一个远程数据中心中,也可以实现相互远程备份。
在标准的实时备份方案中,服务器主机通过SAN与IBM企业存储服务器ESS相连接,两台ESS之间通过ESCON通道实现同步远程拷贝。受ESCON传输距离的限制,当主、备机房的距离超过2公里时,需要加光纤延伸器。光纤延伸器可以从多个不同的厂商购得,比如IBM 2029 Fibre Saver、INRANGE的9801等。在光纤延伸器的帮助下,PPRC数据备份可达到100公里以上。
在这种容灾方案中,核心设备就是IBM的ESS的企业级存储服务器,目前新的型号主要有IBM TotalStorage Enterprise Storage Server (ESS) Model 750/800这两种。
ESS 800型企业级存储服务器支持IBM的多种Windows、UNIX、NetWare等服务器平台之间的存储共享,通过双RISC架构SMP处理器、大容量高速缓存和串行磁盘连接提供出众的性能;使用冗余的硬件、镜像映射的写高速缓存和RAID-5及RAID-10级别的磁盘阵列技术保护支持关键业务应用程序的高可用性。对通过ESCON、FICON、光纤通道、2GB光纤通道/FICON或Ultra SCSI连接的主机支持快速率的数据传输;通过Web浏览器、CLI(命令行界面)或者通过使用ESS API来提供高效、集中的操作管理;使拥有不同种类主机的企业不仅能升至55.9TB的物理磁盘容量,同时能保持更优性能。
对于这种方案中可能用到的SAN交换机在前面已有了这方面的产品介绍,在此不再赘述。不过要注意的是,在IBM的这些容灾方案中都要求全套设备都采用IBM自己的,所以在这种容灾方案中的SAN交换机也需要选择IBM自己的。在IBM中提供多种不同档次的SAN交换机产品,如F08/16/32、M12等机型,可以全面满足各类企业需求。
PPRC容灾方案能够自动将源卷上的数据同步到目标卷,实现以存储为基础的、实时的、与应用无关的数据远程镜像功能,可根据需要选择同步或异步方式。PPRC实现较为简单,纯粹基于硬件,是无数据丢失且具有完全恢复功能的灾难恢复解决方案,需要两个中心均配置IBM的ESS存储服务器。
在同步方式下,PPRC将确保如果备份卷不能被更新,那么即使源卷更新成功,整个写操作也会返回失败——彻底保证源卷和目的卷的数据一致。同步方式可以保证数据完全不丢失和很好一致性保证。数据的一致性非常重要,特别是对于系统和数据库中的数据,不一致的数据无法保证数据的安全,严重时还可能造成数据库无法启动。但要注意,采用同步复制方式对系统性能有较大影响,特别是当两个数据中心服务器不够强壮时。
在异步工作方式下,PPRC能够在远端更新未完成的情况下,通过本地更新成功向主机返回“写成功”信号。其好处是: 在主备机房之间数据链路带宽成为瓶颈时,采用异步方式对数据中心主机房生产系统性能的影响不大。缺点是采取这种方式的数据将有可能丢失。所以当采用异步方式时,IBM建议先采用IBM ESS的快速拷贝功能“FlashCopy”,备份需同步的数据,再进行数据同步。
PPRC在初始连接时需要建立逻辑卷连接,之后PPRC会自动同步该逻辑卷。利用此项功能,可以进行ESS之间的数据迁移(PPRC的同步实现机制如下图所示)。
图中各步解释如下:
① 应用程序将数据写入ESS服务器磁盘;
② 生产系统中的磁盘数据传输到远程备份磁盘;
③ 备份磁盘复制生产系统数据;
④ 将写完操作信息返给生产磁盘,生产系统应用继续执行。
二、应用级灾备——HAGEO
IBM的HAGEO(High Availability Geography)的缩写,是IBM AIX平台优秀的实时灾难备份软件。我们知道,前面介绍的PPRC方案主要是通过硬件来实现的,而此处的HAGEO方案则主要是通过软件实现的,相对来说比较经济,但对硬件的配置也比较苛刻。
这种备份方案理论上对备份中心距离没有限制,利用IP网络,不需要专用光纤;对应用程序、数据库类型和存储设备类型都是透明的,即在HAGEO下应用程序不需修改。但性能较以上介绍的PPRC方案差些,适用于中型企业选用。
HAGEO可以为客户的数据和应用提供同步实时镜像,其中增强型同步(MWC)模式可以提供数据的原始性和一致性,同时HAGEO也提供异步模式。HAGEO和应用程序紧密结合,不仅仅实现数据的实时镜像,同时也可以实现应用的自动接管,大大减少了灾难发生时手工操作。HAGEO可以做到零数据丢失,灾难恢复时间一般在半个小时左右(指应用恢复)。
目前主流的HAGEO异地容灾方案是基于RS/6000平台的,在这种HAGEO环境中,每个交易或任务完成之前,系统都会通过远程网络,先完成生产系统和备份系统的数据更新,保障数据实时一致性。并且像HACMP双机备份一样,提供故障检测和自动实时恢复功能。HACMP是IBM RS/6000平台上的高可用软件,它解决了本地多个服务器之间的互相备份问题。HAGEO将HACMP的功能在地理位置上作了延伸,将HACMP的优势扩展到广域网上,从而提供了一个很好的远程备份解决方案。
IBM HAGEO容灾方案的基本设想是:生产环境是两台RS/6000服务器,组成一个本地的双机热备环境。当本地的一台服务器发生故障时,应用会自动切换到本地另外一台服务器上。在备份地点,由一台RS/6000服务器作为备份服务器。当生产环境中的两台服务器都不能工作时,备份地点的服务器自动启动应用,恢复正常的生产环境,(如下图所示)。
连接两地的网络带宽应大于2MB,以确保两地备份服务器数据同步,具体所采用的网络连接方式可以多样,如专线方式的DDN、T3、互联网宽带接入等。如果应用对I/O的写请求很多,应提高网络带宽,以保证系统的整体性能不受影响。客户端如何访问服务器也是在做方案时需要考虑的一个重要因素。注意,HAGEO方案只能负责到(服务器)系统这一层,在灾难发生后,客户端如何访问备份中心,这一点需要在网络整体设计时加以考虑。
三、NAS容灾方案
虽然NAS方案大家都觉得不如SAN,但它的廉价特性(它是采用传统的IP技术),在目前来说SAN还是无法比拟的,特别是对于中小型企业。针对全国性机构数据集中实时数据复制与灾害备援需求,IBM采用NAS,LTO技术及NSI Software Double-Take 数据同步方案,为全国性机构地市级节点以及省级中心节点提供基于NAS存储平台的数据同步解决方案,以更经济的方式达到备援的目的,并保证系统的高可用性。
该方案对于全国性机构地市级节点的数据通过现有的网络连接,占用更少的网络资源,在第一时间将数据文件以增量的方式传送至省级中心节点。同时也可实现省级中心节点向地市级节点的数据发送。并且在每个地市级节点还可以实现两台NAS存储设备之间的数据实时同步以及系统的灾难备援。并且在磁盘介质备份的基础上,可进一步实现磁盘到磁带的数据备份,以充分满足数据的安全与可用性。其中一种利用公网进行省级与市级数据中心数据通信的网络结构(如下图所示)。
省级中心采用NAS300(如图7所示)系列或更高级的NAS500存储服务器,它上面的数据与各地市级NAS200系列(如图8所示)上数据通过Double Take软件即时或定时保持同步,为公司提供准确的营业数据。地市级中心数据可通过T3、DDN、WAN等连接方式向省级中心进行实时或定时数据同步,充分利用各种网络资源并最小化投资与运营成本。
基于 I/O 网络流量的多少,IBM NAS Gateway 300可以支持每单位1000个以上基于IP的客户机。要为每个用户提供足够的存储容量,最多可分配22TB的存储量。NAS300兼容IBM企业存储服务器(ESS)、FAStT200、FAStT500、FAStT700和其它供应商提供的设备。IBM NAS Gateway 300 预装了 Tivoli SANergy软件,该软件使用户能通过较高的吞吐量但较低的开销以文件、卷和字节级别访问SAN 中的存储设备。通过它而在IP客户机与SAN之间建立的高性能链接有助于利用两个网络中的现有投资。
NAS 200的存储容量在109.2GB到3.52TB之间提供了一条不间断的容量升级路径,允许您“按增长支付”,保护您的投资。而且提供数据保护的多级RAID和高级软件,帮助您确保业务连续性,实现跨平台(Windows [CIFS]、UNIX [NFS]、HTTP、FTP、ApplTalk和NetWare)文件共享,有助于减少网络复杂性和维护费用,允许数据在整个企业内使用。
省级中心存储数据的NAS存储服务器上安装DoubleTake软件,并同时把它指定为Target端与Source端,一方面完成地市级数据向省级中心同步的功能(Target),另一方面可以实现省级中心向地市级数据中心下发数据的需要(Source)。
在省级中心NAS300存储设备上连接IBM LTO系列磁带设备以实现数据的双重备份与保护。建议客户在省级数据中心安装Double Take Console控制台软件,以管理本省及下属地市Double Take Source and Target的工作。
地市级数据中心NAS服务器上数据通过Double Take 软件即时或定时与省级中心NAS服务器保持同步,在正常运行状态下业务数据NAS1与管理数据NAS2分开。但NAS1与NAS2可互为备援,当故障产生时,NAS1或NAS2可接替对方工作从而保证数据的高可用性。
地市级中心数据可通过T3、DDN、WAN等连接方式向省级中心进行实时或定时数据同步,这样可以保障地市级的数据的安全性。各地市级存储数据的每台NAS200存储服务器为需要备份数据的服务器。在其上安装Double Take软件,并指定为Target端与Source端,一方面完成地市级数据向省级中心同步的功能(Source),另一方面可以实现地市级中心NAS1与NAS2之间的实时数据同步与相互备援(Target & Source)。 Double Take的管理工作由省级中心完成。
该方案对应用透明,数据同步由存储系统独立完成,极大提高了系统的可用性与数据的一致性;在数据集中的基础上,TCO整体拥有成本极大降低;实现数据的集中,同步,高可用,备份与备援一体化方案。IBM NAS 产品与 NSI Double-Take 软件的多个模式共同使用,使得用户可以根据自己的环境灵活地选择适合的配置。
四、编后语
以上介绍了IBM针对不同企业用户需求推出的三种数据异地容灾方案,它们各有特点。PPRC方案有用的是纯硬件方案,具有更好的数据传输性能,而且适用于几乎所有的主流系统操作平台和IBM的硬件服务器平台,但一般只用于数据备份中心相距数据源公司100公里以内的企业选用。而且投资很大,不是一般企业可以随得起的。HAGEO方案则主要依赖软件,数据传输性能较差,而且是为IBM AIX UNIX服务器专门开发的,但相对来说投资比较低,适用于中型企业选用。对于NAS方案,由于采用的通常是采用公网传输(也可用专线),传输性能很差,但网络使用传统的IP技术,投资更经济,连接距离较广(可在全球范围内),适合于企业总与小型各分支机构之间的数据备份。