Higor
作者Higor·2021-11-22 14:51
技术支持·浪潮商用机器有限公司

某城商行PowerHA与DS8000 HyperSwap for i案例分享

字数 3547阅读 1264评论 0赞 0

从 IBM 发布了 PowerHA for i V1.0(PowerHA 6.1) 以来,国内部分农信社和城商行把以前纯逻辑复制 (Logical Replication,常用软件如 MIMIX,OMS,iCluster 等 ) 的解决方案转换到 PowerHA for i 结合 DS8000 存储复制的高可用解决方案,通过存储同步复制机制优化了逻辑复制方案在银行系统夜间批处理时数据追平较长时间差的问题,并通过存储快照 (FlashCopy) 实现了批前和批后数据的离线备份。
在这些金融客户成功案例里包含了下图所列的 Lun-Level Switch,MetroMirror,GlobalMirror 等几种解决方案的组合方案来实现两地三中心的架构。

1、案例背景
本案例客户在 2012 年即实现从纯逻辑复制到 PowerHA+MetroMirror+ 逻辑复制的组合方案的转换,但由于其生产中心备机和同城灾备机同为超期服役的 Power5 机型, 且其操作系统版本较低已停止服务 (End of Service) 多年,所以整套环境具有潜在的稳定性风险,按同业经验在更换服务器 + 存储提升设备可靠性的前提下也同步提升整套系统架构的可用性。
其原有生产中心和同城中心架构示意图如下:

2、方案设计
DS8000 HyperSwap 能为计划内和计划外的存储中断提供接近零的停机时间,提供近乎连续的可用性,这使得应用程序能够在对最终用户影响最小的情况下继续运行。
在 PowerHA for i V3(PowerHA 7.2) 发布后, DS8000 的 HyperSwap 功能也适配了 IBM i 平台。随着 PowerHA 的功能不断增强,其从最开始的全系统复制 (V3.0) 到 HyperSwap 支持 IASP(V3.1) 和支持 GlobalMirror(V3.2) 。
本案例客户采用了 PowerHA+MetroMirror 混合架构高可用解决方案时已完成了 IBM i 操作系统 (SYSBAS) 和 DB2 数据库分离 (IASP) 的存储池管理模式,所以应用 DS8000 的 HyperSwap 功能无需对客户的应用数据做任何改动,就可以平滑地升级到 HyperSwap 架构,在 PowerHA V3.1 发布后我们规划了服务器和存储一起升级的解决方案。

2.1 架构规划
基于原有架构,结合 HyperSwap 功能,我们规划了新的银行核心系统基础架构,其逻辑示意图如下:

在新的架构里除了保障 IASP 具有 HyperSwap 关系之外,生产中心的主备服务器分区 AB 的 SYSBAS 也需要实现 HyperSwap 功能,所以生产中心每台 DS8000 里需要为对端的 SYSBAS 提供额外一份相同规模的磁盘空间。比如在 DS8K-1 里需要为备份分区 B 的 SYSBAS 提供一份磁盘空间 SYSBAS B’ ,SYSBAS B 和 B’ 形成 HyperSwap 关系 ( 同理 SYSBAS A 和 A’ 也是 HyperSwap 关系 ) ,这样可以确保任何一台存储停机不影响操作系统 ASP 和数据库 IASP 的可用性。
为了实现数据离线备份,在生产中心的主备服务器 (Server1 、 Server2) 上各划分了一个分区 ( 分区 CD) 用来操作快照 (Flashcopy) 和数据备份作业。正常情况下分区 D 执行快照和备份作业,分区 C 是关机状态其为分区 D 的备用环境 ( 注: 2 个快照分区 CD 不做 HyperSwap 功能 ) 。
同样保持逻辑复制功能将生产机数据传送到同城中心灾备服务器上,因监管要求实际上客户还有另一条逻辑复制链路到异地灾备环境 ( 未画在上述逻辑架构图 ) 。
新架构与原有架构服务器生产分区 AB 之间采用了不同的高可用方案,在原有架构里,生产环境里服务器分区 A 或存储 1 之中任何一个环节故障都会造成系统服务整体切换到备份环境上;
而在新的 HyperSwap 架构里若存储 DS8K-1 故障则不存在系统服务切换,仍由分区 A 提供服务,只是在分区 A 出现故障时才通过 LUN-Level Switch 技术切换到分区 B , IASP LUN 在 2 个存储里仍保持 HyperSwap 关系。

2.2 服务器存储规划
除了高可用方案架构的优化,我们对服务器和存储配置也做了细化,下面介绍存储空间规划和对应到服务器端 HBA 卡的规划。
根据磁盘容量需求, DS8K-1 存储使用 RAID5 模式,划分 3 套 32 个 70GB 的 LUN 作为 SYSBAS 空间, 2 套 256 个 70GB 的 LUN 为生产环境 IASP 和快照 IASP 空间; DS8K-2 亦采用相同的空间划分方式。
所有 LUN 都采用 2 路径链接,由于 SYSBAS 只有 32 个 LUN ,故 2 张 HBA 卡即可承担负载; IASP 空间的 256 个 LUN 则规划了 8 张 HBA 卡,在 2 路径的模式下,每张 HBA 卡的每 Port 同样承载 32 个 LUN( 每张双口 HBA 卡共承载 64 个 LUN ,因 IBM i 是统一地址空间管理,需要更多数量的小容量 LUN 来获得更好的磁盘性能,而每张 HBA 所承载的 LUN 的个数因操作系统版本不同是有不同的限值,通常不会让每个 Port 承载最大限值的 LUN 个数 ) 。
下图展示了银行核心系统环境下每台存储所需的有效磁盘空间和每个服务器分区对应的 HBA 卡数量,而服务器 CPU 性能需求则根据业务增长预期的方式估算了新服务器的性能需求,这里不赘述。

本次项目 DS8000 HyperSwap for IASP 架构软硬件参数:
• IBM i 7.3
• IBM PowerHA for i 企业版
• 2 台 DS8800 含 Copy Service 软件许可

3、总结
在按计划完成系统部署后,对整套高可用环境进行了不同场景的演练测试和性能测试,其结果较原高可用架构在 RTO 的各项指标上都得到不少提升。
由于客户同时部署了 2 套相同架构的 HyperSwap 环境在 2 套服务器和存储上,加载全套数据后经实测,整套环境在存储 HyperSwap 切换时 RTO 小于 2 秒,在模拟生产分区 A 故障的情况执行 Lun Level Switch 的 RTO 小于 2 分钟。存储底层采用了同步复制机制,故切换都不会造成数据丢失即 RPO=0 。
由于服务器分区间切换需要加载 IASP 及 DB2 数据库,所以这个阶段耗时较多,从 V6.1 开始 IBM 都在不断优化 IASP 的 VARYON 时间,所以在客户环境里我们看到了服务器切换的 RTO 能小于 2 分钟,较以前架构缩短了 50% 以上的启动时间 , 极大地缩短了系统恢复时间。
到目前为止,这套 PowerHA+HyperSwap 架构已健康运行了 2 年多,我们也在不断利用新技术来提升 IBM i 环境的高可用性。
从上面的高可用架构里我们能看到,服务器无论计划内或计划外停机都会造成系统的切换,没有做到真正的 RTO=0 。在 2019 年 IBM 发布了 Db2Mirror 双活技术,能做到服务器和存储故障都不影响业务运行,实现了真正意义上双活,我们期待有类似案例上线并届时分享。

4、附名词注释
ASP: 在 IBM i( 俗称 AS/400) 环境里,其单级存储 (Single Level Storage) 管理模式将内存和磁盘空间视为一个大的存储池,内存叫主存 (Main Memory) ,磁盘空间叫辅助存储池 (Auxiliary Storage Pool) 。
SYSBAS: 即 ASP1( 第一个辅助存储池 ) , IBM i 操作系统安装于这个池子里,类似 AIX 环境的 ROOTVG 。一般客户的 DB2(DB2/400 或 DB2 for i) 也安装在 ASP1 里,可以理解为 ROOTVG 既装操作系统又装数据库。
IASP: 独立辅助存储池 (Independent Auxiliary Storage Pool) ,在结合 PowerHA 使用存储复制功能的情形下, IASP 是必须的,即 DB2 数据库安装在 IASP 。其类似 AIX 环境的 DataVG ,可以加载卸载,但 IASP 在某一时间点仅加载在一个节点上,无法支持 2 个节点同时加载 ( 即不支持 Concurrent) 。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

0

添加新评论0 条评论

Ctrl+Enter 发表

相关文章

相关问题

相关资料

X社区推广