zwz99999
作者zwz99999·2020-04-21 14:57
系统工程师·dcits

IBM GDR技术介绍及应用场景

字数 3681阅读 1256评论 0赞 1

IBM GDR技术介绍及应用场景
1.GDR 技术简介
GDR 技术是 Geographically Dispersed Resiliency for Power System 的简称,直译 为 Power 系统的地域分散弹性技术。GDR
技术 提供了一种在灾备站点实现虚拟分区自动重启的能力,并且负责管理相关的硬 件复制过程(类似于 VMware 公司的 SRM 技术)。 GDR 灾难恢复解决方案易于部署和管理。 GDR 可以管理跨站点的多个虚拟机的恢复。 GDR 通过与 HMC 和 VIOS 紧密集成来重新启动 VM 。 GDR
提供了广泛的自动化,这样管理员就可以为 DR 快速部署 配置,并跨站点进行故障转移。
1.1 GDR 技术的基础架构
如下图所示, GDR 技术的基础架构涉及到几个重要的组成部分,分别是:主机,虚拟机,VIOS,HMC, 存储和 K sys 分区。

主机是指分布在异地站点上的 Power 服务器物理硬件, 作为虚拟机的宿主硬件。虚拟机是指 在 Power 服务器上跑的虚拟分区(该分区的所有 I/ O 资源必须使用虚拟 I/O 资源),业务负载运行在这些虚拟机上。 VIOS 指的是每一台 Power 服务器部署的虚拟 I/O 服务器( Virtual I/O Server, 简称 VIOS 所有的业务分区的 I/O 资源都由 VIOS 提供,包括:虚拟网络,虚 拟光纤通道,虚拟 SCSI 总线等。 HMC 是 Power 服务器特有的硬件管理控制台( Hardware Manage
Console ,简称 HMC ),每个站点至少配置 1 台用于管理站点内 Power 服务器。 存储负责提供 虚拟分区的操作系统盘和数据盘的远程镜像能力。 K sys 分区是安装在备站点 的一个 AIX 分 区上的一组 文件集( K sys 本身包含 8 组文件集)。 K sys 用来管理整个灾备环境。
1.2 GDR 的前提条件
以下的表列出了实施 GDR 容灾方案的前提条件:

1.3 GDR 的优势
GDR 作为 IBM Power 的新灾备解决方案主要是弥补了,原有的 PowerHA XD, PowerHA HyperSwap 等灾备方案对于非关键业务的不足。原有的技术切换时间更短,但是需要依赖比 较昂贵的 HA 软件费用。这些特性不适用于非关键业务,在原有的 IBM 灾备解决方案中不涉 及非关键业务的容灾 自动化 。非关键业务的特点决定了这些业务的灾备方案可以接受一定时间的业务停止服务,但是 对于方案的复杂性和价格比较敏感。 有个别客户通过自己写脚本来实现虚拟机在灾备站点的 重启,但是这需要客户自己维护大量复杂的脚本。 而 GDR 技术刚好满足的客户对于非关键 业务的灾备需求。 GDR 在计划内容灾演练、计划外容灾切换过程中自动化完成系统级的工作,减少运维人员的工作量,让运维人员把精力放在应用的启动、测试中。
GDR可维护性好,平时对生产环境的性能没有影响; GDR 也支持在不影响生产环境的情况下,在灾备环境进行演练工作 。 当部署 完之后,不需要更新微码,除非要实现新版本中的功能,新版本又需要有更新微码的支持 。
从下图不难看出拥有几百个虚拟分区的系统分区在灾备站点重启的时间也只有几十分

2 GDR 高级技术特性
2.1 非中断容灾演练

在容灾解决方案中,容灾演练一直是企业容灾方案中的老大难问题。如果不进行容灾演练 ,那么无法保证问题发生时系统能够顺利切换。如果进行容灾演练,那么可定需要中断生产系统,而且还要冒演练失败影响生产系统的风险。
 这一问题在 GDR 的方案中得到了完美的解决, GDR 本身提供了非中断容灾演练的 新特性。这一新特性使得客户可以在不中断,不影响生产系统服务的情况下进行容灾演练。 这个特性的基本原理是在灾备站点的存储上对主站点的镜像 S2 再生成一个快照 S2C ,然后基于 S2C  

启动需要演练的虚拟分区来检查容灾切换是否可以正常的实施。

  这样在演练的同一时间,生产系统上的分区依然保持正常地运行。这样可以确保生产系统的服务不会受到任何影响。


2.2 灵活的灾备容量管理
在多数灾备方案中异地灾备中心的硬件配置要低于主中心的生产系统硬件配置。甚至在 有些场景中是灾备中心的一台机器对应主中心的多台服务器。这必然要 求容灾解决方案能够 提供灵活管理计算资源的方法。 GDR 的解决方案中确实提供了相关的特性。在虚拟分区在灾
备站点重新启动的时候,分配的 CPU 和内存资源是可以按照配置文件 中预先设置的百分比调 整资源的。系统管理员可以通过 k sys 的命令来更改这种设定, k sys 会将更改更新到配置 文件中。

这种调整可以缩小也可以扩大,甚至设定成分区 Profile 中定义的最小值。而且,资源的配置可以通过虚拟机,主机,主机组和站点等几个级别进行灵活设定。
2.3 基于权重的重启排序
在真实的场景中,多个业务分区之间可能有依赖关系,例如:应用分区可能需要依赖于数据库分区先启动。为了解决这一实际需求, GDR 的解决方案中提供了虚拟分区按照设定权重依次启动的功能。管理员可以通过 K sys 命令设定虚拟分区的启动权重并保存在配置文件中。当切换发生时,系统将按照配置文件中设定的虚拟分区启动权重顺序启动各个分区。默 认情况下所有分区的启动权重都是 Medium 级别。

2.4 基于主机组的灾备策略
为了适应大型企业的灾备管理需求, GDR 在设计时默认支持以主机组作为灾备策略的 执行粒度。所以,当需要迁移的设备很多时,管理员可以将同一业务负载的主机组成一个主机 组,并直接对主机组执行切换操作。这样可以大大降低系统的维护复杂度。每一个主机组会
分配单独的磁盘组。每一个主机都需要添加到一个主机组,没有指定主机组的主机会被加入到 Default_HG 组。

2.5 VLan/vSwitch的站点间匹配
GDR 支持主站点的 VLan/vSwitch 和备站点的 VLan/vSwitch 使用不同的命名,并提供命令将二者之间进行匹配映射。这样可以保证在多对一的灾备解决方案中确保备站点启动的虚拟分区可 以匹配到正确的虚拟网络资源。

2.6 日常自动验证
灾备方案切换失效多数是由于方案中涉及的部件配置被更改或连接失效。 GDR 提供了定时自动检验的框架。管理员既可以让系统每天自检,发现问题后通过邮件或者警告提醒管理员。也可以将自定义的脚本插入到自动检测框架内来完成更复杂的 任务 。

2.7 支持企业资源池( Power Enterprise Pool
除了前面 GDR 自带的特性外, GDR 还能支持企业资源池的技术。支持 CPU 和内存的活动激活许可在主站点和备站点之间移动。这样可以减少备站点设备的激活采购数量。更多关
于 Power Enterprise Pool 的相关信息,请参考
https://www.ibm.com/support/knowledgecenter/zh/POWER8/p8ha2/systempool_cod.htm

3.应用场景
GDR 灾备方案主要面向的是非关键应用系统的灾备,底层数据基于存储复制,上层应用分区基于远程重启技术。 下面是几种常见的应用场景。

  • 主备模式
    主备站点服务器 1 对 1 对 应采用 GDR 方案常见于客户新建机房后采购新的 Power8 服务器替换原有的 Power7 服务器。原有的 Power7 服务器作为灾备站点的宿主硬件和新的 主站点的 Power8 服务器一一配对组成灾备关系。
  • 灾备云模式
    主备站点服务器 n 对 1 的灾备云模式 是 DRaaS Disaster Recovery as a Service )的一种具
    体实现 。如下图所示, Host11,Host12 同时把灾备环境映射到备战点的 Host21 上,同时使用2 套 K sys 分别独立管理 2 套灾备环境。在实际环境中, Host11,Host12 还可以属于完全不同 的 2 个站点甚至 2 家不同公司,这样灾备中心的服务器可以给多家机构的多台服务器复用为灾备宿主机。这样可以在满足服务标准的同时提高灾备中心服务器的利用率。
  • 两站点双活互备 模式
    两站点双活互备模式 主要应用于对等站点互备的场景。比如同城双中心 应用互备。在这 一场景中,两个站点的服务器上各自承担了一部分业务负载分区。 同时各自的分区又和远端服务器形成灾备配对关系。每个服务器上运行着 2 个包含 K sys 功能的分区,其中活动的 K sys
    分区负责管理远端业务分区的灾备任务。而不活动的 K sys 分区和远端服务器上的活动 K sys分区形成互备关系。底层的两套存储之间也会成为数据互为镜像 的关系。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

1

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关问题

X社区推广