fenglei506
作者fenglei506·2019-07-08 12:21
存储工程师·宏杉科技

IBM三种容灾解决方案

字数 5541阅读 2912评论 0赞 4

在前一篇中我们介绍数据容灾的重要性和相关技术,从中了解到了数据容灾与我们常见的数据备份是两个不完全等同的概念。在数据容灾中最常采用,也是最有效的方案是异地容灾。这种容灾方案最有保障,因为它是把数据备份保存在另一地方,甚至另一个国家,这样数据就会更安全。试想一下在伊拉克这样连成战争不断的国家,即使把数据保存在了本国其它地方也是不安全的,所以有许多数据存储厂商提出了全球容灾的方案。从本篇起要向大家介绍几个典型的数据存储厂商的异地容灾方案,本篇所介绍的是全球最为著名的数据存储厂商 --IBM 的几种异地容灾方案。

针对不同的用户需求, IBM 公司的异地容灾方案产品线非常丰富,各种数据备份技术和应用方案层出不穷,处于全球领先地位。它的这些容灾方案不可能全在本文中介绍清楚,所以只选三个常见的方案类型向大家介绍。

一、数据级灾备--PPRC

IBM 的 PPRC ( Peer to Peer Remote Copy ,点对占点远程复制)复制技术是基于 ESS 企业级数据存储服务器,通过 ESCON ( Enterprise Systems Connection ,企业管理系统连接,是一种光纤通道)通道建立配对的逻辑卷容灾技术。这是 IBM 的最高级别容灾方案,主要适用于大、中型和电信企业选用。它的网络结构(如图 1 所示)。

在图中数据中心 A 和数据中心 B 可以是两相隔上百公里的网络系统,既可以单独把某个数据中心的数据备份到另一个远程数据中心中,也可以实现相互远程备份。

在标准的实时备份方案中,服务器主机通过 SAN 与 IBM 企业存储服务器 ESS 相连接,两台 ESS 之间通过 ESCON 通道实现同步远程拷贝。受 ESCON 传输距离的限制,当主、备机房的距离超过 2 公里 时,需要加光纤延伸器。光纤延伸器可以从多个不同的厂商购得,比如 IBM 2029 Fibre Saver 、 INRANGE 的 9801 等。在光纤延伸器的帮助下, PPRC 数据备份可达到 100 公里 以上。

在这种容灾方案中,核心设备就是 IBM 的 ESS 的企业级存储服务器,目前最新的型号主要有 IBM TotalStorage Enterprise Storage Server ( ESS ) Model 750/800 这两种,(如图 2 所示)。

ESS 800 型企业级存储服务器支持 IBM 的多种 Windows 、 UNIX 、 NetWare 等服务器平台之间的存储共享,通过双 RISC 架构 SMP 处理器、大容量高速缓存和串行磁盘连接提供出众的性能;使用冗余的硬件、镜像映射的写高速缓存和 RAID-5 及 RAID-10 级别的磁盘阵列技术保护支持关键业务应用程序的高可用性。对通过 ESCON 、 FICON 、光纤通道、 2GB 光纤通道/ FICON 或 Ultra SCSI 连接的主机支持快速率的数据传输;通过 Web 浏览器、 CLI (命令行界面)或者通过使用 ESS API 来提供高效、集中的操作管理;使拥有不同种类主机的企业不仅能升至 55.9TB 的物理磁盘容量,同时能保持最优性能。

对于这种方案中可能用到的 SAN 交换机在前面已有了这方面的产品介绍,在此不再赘述。不过要注意的是,在 IBM 的这些容灾方案中都要求全套设备最好采用 IBM 自己的,所以在这种容灾方案中的 SAN 交换机也需要选择 IBM 自己的。在 IBM 中提供多种不同档次的 SAN 交换机产品,如 F08/16/32 、 M12 等机型,可以全面满足各类企业需求。

PPRC 容灾方案能够自动将源卷上的数据同步到目标卷,实现以存储为基础的、实时的、与应用无关的数据远程镜像功能,可根据需要选择同步或异步方式。 PPRC 实现较为简单,纯粹基于硬件,是无数据丢失且具有完全恢复功能的灾难恢复解决方案,需要两个中心均配置 IBM 的 ESS 存储服务器。

在同步方式下, PPRC 将确保如果备份卷不能被更新,那么即使源卷更新成功,整个写操作也会返回失败 -- 彻底保证源卷和目的卷的数据一致。同步方式可以保证数据完全不丢失和很好一致性保证。数据的一致性非常重要,特别是对于系统和数据库中的数据,不一致的数据无法保证数据的安全,严重时还可能造成数据库无法启动。但要注意,采用同步复制方式对系统性能有较大影响,特别是当两个数据中心服务器不够强壮时。

在异步工作方式下, PPRC 能够在远端更新未完成的情况下,通过本地更新成功向主机返回 " 写成功 " 信号。其好处是 : 在主备机房之间数据链路带宽成为瓶颈时,采用异步方式对数据中心主机房生产系统性能的影响不大。缺点是采取这种方式的数据将有可能丢失。所以当采用异步方式时, IBM 建议先采用 IBM ESS 的快速拷贝功能 "FlashCopy" ,备份需同步的数据,再进行数据同步。

PPRC 在初始连接时需要建立逻辑卷连接,之后 PPRC 会自动同步该逻辑卷。利用此项功能,可以进行 ESS 之间的数据迁移( PPRC 的同步实现机制如图 3 所示)。

二、应用级灾备--HAGEO

IBM 的 HAGEO ( High Availability Geography )的缩写,是 IBM AIX 平台最优秀的实时灾难备份软件。我们知道,前面介绍的 PPRC 方案主要是通过硬件来实现的,而此处的 HAGEO 方案则主要是通过软件实现的,相对来说比较经济,但对硬件的配置也比较苛刻。

这种备份方案理论上对备份中心距离没有限制,利用 IP 网络,不需要专用光纤;对应用程序、数据库类型和存储设备类型都是透明的,即在 HAGEO 下应用程序不需修改。但性能较以上介绍的 PPRC 方案差些,适用于中型企业选用。

HAGEO 可以为客户的数据和应用提供同步实时镜像,其中增强型同步( MWC )模式可以提供数据的原始性和一致性,同时 HAGEO 也提供异步模式。 HAGEO 和应用程序紧密结合,不仅仅实现数据的实时镜像,同时也可以实现应用的自动接管,大大减少了灾难发生时手工操作。 HAGEO 可以做到零数据丢失,灾难恢复时间一般在半个小时左右(指应用恢复)。

目前最为主流的 HAGEO 异地容灾方案是基于 RS/6000 平台的,在这种 HAGEO 环境中,每个交易或任务完成之前,系统都会通过远程网络,先完成生产系统和备份系统的数据更新,保障数据实时一致性。并且像 HACMP 双机备份一样,提供故障检测和自动实时恢复功能。 HACMP 是 IBM RS/6000 平台上的高可用软件,它解决了本地多个服务器之间的互相备份问题。 HAGEO 将 HACMP 的功能在地理位置上作了延伸,将 HACMP 的优势扩展到广域网上,从而提供了一个很好的远程备份解决方案。

IBM HAGEO 容灾方案的基本设想是:生产环境是两台 RS/6000 服务器(如图 4 所示),组成一个本地的双机热备环境。当本地的一台服务器发生故障时,应用会自动切换到本地另外一台服务器上。在备份地点,由一台 RS/6000 服务器作为备份服务器。当生产环境中的两台服务器都不能工作时,备份地点的服务器自动启动应用,恢复正常的生产环境,(如图 5 所示)。

连接两地的网络带宽应大于 2MB ,以确保两地备份服务器数据同步,具体所采用的网络连接方式可以多样,如专线方式的 DDN 、 T3 、互联网宽带接入等。如果应用对 I/O 的写请求很多,应提高网络带宽,以保证系统的整体性能不受影响。客户端如何访问服务器也是在做方案时需要考虑的一个重要因素。注意, HAGEO 方案只能负责到(服务器)系统这一层,在灾难发生后,客户端如何访问备份中心,这一点需要在网络整体设计时加以考虑。

三、NAS容灾方案

虽然 NAS 方案大家都觉得不如 SAN ,但它的廉价特性(它是采用传统的 IP 技术),在目前来说 SAN 还是无法比拟的,特别是对于中小型企业。针对全国性机构数据集中实时数据复制与灾害备援需求, IBM 采用 NAS , LTO 技术及 NSI Software Double-Take 数据同步方案,为全国性机构地市级节点以及省级中心节点提供基于 NAS 存储平台的数据同步解决方案,以最经济的方式达到备援的目的,并保证系统的高可用性。

该方案对于全国性机构地市级节点的数据通过现有的网络连接,占用最少的网络资源,在第一时间将数据文件以增量的方式传送至省级中心节点。同时也可实现省级中心节点向地市级节点的数据发送。并且在每个地市级节点还可以实现两台 NAS 存储设备之间的数据实时同步以及系统的灾难备援。并且在磁盘介质备份的基础上,可进一步实现磁盘到磁带的数据备份,以充分满足数据的安全与可用性。其中一种利用公网进行省级与市级数据中心数据通信的网络结构(如图 6 所示)。

  1. 省级数据中心

省级中心采用 NAS300 (如图 7 所示)系列或更高级的 NAS500 存储服务器,它上面的数据与各地市级 NAS200 系列(如图 8 所示)上数据通过 Double Take 软件即时或定时保持同步,为公司提供准确的营业数据。地市级中心数据可通过 T3 、 DDN 、 WAN 等连接方式向省级中心进行实时或定时数据同步,充分利用各种网络资源并最小化投资与运营成本。

基于 I/O 网络流量的多少, IBM NAS Gateway 300 可以支持每单位 1000 个以上基于 IP 的客户机。要为每个用户提供足够的存储容量,最多可分配 22TB 的存储量。 NAS300 兼容 IBM 企业存储服务器( ESS )、 FAStT200 、 FAStT500 、 FAStT700 和其它供应商提供的设备。 IBM NAS Gateway 300 预装了 Tivoli SANergy 软件,该软件使用户能通过较高的吞吐量但较低的开销以文件、卷和字节级别访问 SAN 中的存储设备。通过它而在 IP 客户机与 SAN 之间建立的高性能链接有助于利用两个网络中的现有投资。

NAS 200 的存储容量在 109.2GB 到 3.52TB 之间提供了一条不间断的容量升级路径,允许您 " 按增长支付 " ,保护您的投资。而且提供数据保护的多级 RAID 和高级软件,帮助您确保业务连续性,实现跨平台( Windows [CIFS] 、 UNIX [NFS] 、 HTTP 、 FTP 、 ApplTalk 和 NetWare )文件共享,有助于减少网络复杂性和维护费用,允许数据在整个企业内使用。

省级中心存储数据的 NAS 存储服务器上安装 DoubleTake 软件,并同时把它指定为 Target 端与 Source 端,一方面完成地市级数据向省级中心同步的功能( Target ),另一方面可以实现省级中心向地市级数据中心下发数据的需要( Source )。

在省级中心 NAS300 存储设备上连接 IBM LTO 系列磁带设备以实现数据的双重备份与保护。建议客户在省级数据中心安装 Double Take Console 控制台软件,以管理本省及下属地市 Double Take Source and Target 的工作。

  1. 地市级数据中心

地市级数据中心 NAS 服务器上数据通过 Double Take 软件即时或定时与省级中心 NAS 服务器保持同步,在正常运行状态下业务数据 NAS1 与管理数据 NAS2 分开。但 NAS1 与 NAS2 可互为备援,当故障产生时, NAS1 或 NAS2 可接替对方工作从而保证数据的高可用性。

地市级中心数据可通过 T3 、 DDN 、 WAN 等连接方式向省级中心进行实时或定时数据同步,这样可以保障地市级的数据的安全性。各地市级存储数据的每台 NAS200 存储服务器为需要备份数据的服务器。在其上安装 Double Take 软件,并指定为 Target 端与 Source 端,一方面完成地市级数据向省级中心同步的功能( Source ),另一方面可以实现地市级中心 NAS1 与 NAS2 之间的实时数据同步与相互备援( Target & Source )。 Double Take 的管理工作由省级中心完成。

该方案对应用透明,数据同步由存储系统独立完成,极大提高了系统的可用性与数据的一致性;在数据集中的基础上, TCO 整体拥有成本极大降低;实现数据的集中,同步,高可用,备份与备援一体化方案。 IBM NAS 产品与 NSI Double-Take 软件的多个模式共同使用,使得用户可以根据自己的环境灵活地选择适合的配置。

四、编后语

以上介绍了 IBM 针对不同企业用户需求推出的三种数据异地容灾方案,它们各有特点。 PPRC 方案有用的是纯硬件方案,具有最好的数据传输性能,而且适用于几乎所有的主流系统操作平台和 IBM 的硬件服务器平台,但一般只用于数据备份中心相距数据源公司 100 公里 以内的企业选用。而且投资最大,不是一般企业可以随得起的。 HAGEO 方案则主要依赖软件,数据传输性能较差,而且是为 IBM AIX UNIX 服务器专门开发的,但相对来说投资比较低,适用于中型企业选用。对于 NAS 方案,由于采用的通常是采用公网传输(也可用专线),传输性能最差,但网络使用传统的 IP 技术,投资最经济,连接距离较广(可在全球范围内),适合于企业总与小型各分支机构之间的数据备份。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

4

添加新评论0 条评论

Ctrl+Enter 发表

相关文章

相关问题

相关资料

X社区推广