fengjian
作者fengjian·2021-07-29 09:42
系统工程师·ips

K1 Power私有云上的高可用方案-VM Recovery Manager HA

字数 2524阅读 2359评论 0赞 2

最近有 K1 Power 的用户问到一个问题,他们收到的 K1 Power 服务器随机光盘中有一张 VM Recovery Manager HA 的光盘,这个是干什么用的,现在来简单回答一下。

VM Recovery Manager HA 是什么?

VM Recovery Manager HA (简称 VMR HA )是一个 K1 Power 私有云环境上的高可用解决方案,它提供了一个自动化的解决方案来恢复虚拟机( VM ,也就是我们常说的 vioc )。这里要说明一下, VMR HA 只管理纯虚拟化的分区,也就是没有物理板卡的虚拟机。

VMR HA 基于 VM 重启技术实现虚拟机的恢复。 VM 重启技术不同于传统的基于集群(比如 PowerHA )的技术,平时虚机运行时不需要再启一个备机,不会浪费 CPU 、内存资源,同时也减少了相应的软件 License 费用。此外, VMR HA 更易于管理,因为它没有一般高可用集群那么复杂。

下图显示了 VM Recovery Manager HA 方案的体系结构。

从上图中可以看到, 12 台 K1 Power 主机被分为一组(主机组),相互备份。当检测到故障时,将在组中其他正常主机上重新定位并重新启动虚拟机。 VMR HA 是基于共享存储的,操作系统和用户数据都保存在存储上,只要是 VIOS 支持的存储, VMR HA 都可以支持。

可以看到, VMR HA 适用于为云环境中的众多 VM 提供高可用性保障。

图中的 KSYS 是什么?

KSYS 是 VMR HA 的控制软件,包括带外监视和管理组件。整个云环境的 HA 配置、监控、故障切换等操作都是由 KSYS 来完成的。如果 KSYS 检测到主机、 VM 或关键应用程序出现故障, KSYS 将在另一个主机中重启虚拟机,完成故障切换操作。

KSYS 软件安装在 AIX 7.2.2 或更高版本的分区中。随机光盘里就是 KSYS 的安装文件。另外还有 GUI 安装文件,有了它就可以在浏览器上进行配置管理了,这样更直观、更方便。

VMR HA 的使用场景有哪些:

VMR HA 的使用场景主要有三类 :

计划内虚机迁移,比如服务器维护、服务器负载再均衡时,使用 LPM 实现虚机迁移

计划外故障转移,比如服务器意外停机、虚机故障等情况下,使用 Remote Restart 技术实现虚机自动重启

虚机内的应用无法正常提供服务的情况下,直接重启应用或在其它服务器上重启虚机

VMR HA 和传统PowerVM的管理方式下的高可用比有什么提升?

使用 HMC 、 PowerVC 管理 PowerVM 的时候同样支持 LPM 和 Remote Restart ,为什么还要搞 VMR HA 呢。主要是因为 HMC 、 PowerVC 并不是专门用来做高可用的,只提供有限的高可用功能。而 VMR HA 作为一个完整的高可用解决方案,它能提供主机、虚机、应用三个层面的监控能力( HMC 、 PowerVC 只能提供主机层的有限监控),同时具备更丰富的 HA 策略设置,帮助完成自动化的 HA 切换操作。

VMR HA 的监控是怎么实现的?

VMR HA 能提供主机、虚机、应用三个层面的监控能力。

主机层面, KSYS 系统将通过 HMC 获取主机状态,同时会启用每个受管主机的 VIOS 分区中的主机监视器( host monitors )来自动监视主机的运行状况。

虚机层面,您可以选择在运行 AIX 或 Linux 操作系统的虚拟机中安装 VM 代理( VM agents ),以监视虚拟机的运行状况。

应用层面,在安装了 VM 代理( VM agents )的虚机上,您可以通过轻量级应用程序监控框架来管理 HA 应用程序。 VMR HA 中自带了 Oracle 、 DB2 、 POSTGRES 、 HANA 的应用监控、管理程序,当然,您也可以通过 ksysvmmgr 命令注册管理自己的应用程序,这一点和 PowerHA 中的应用管理方式相似,需要提供应用监控和启停脚本。

VMR HA 中可设置的 HA 恢复策略有哪些?

VMR HA 可设置的 HA 恢复策略主要包括:

  1. 设置是否启用 HA monitoring
  2. 设置是否启用 ProactiveHA monitoring 监控受管 VM 的 CPU 利用率和网络数据包丢失情况。默认情况下, ProactiveHA 选项处于启用状态。
  3. 设置发生故障时是否自动重启虚机
  4. 设置主机、虚机故障检测时间
  5. 指定多个 VM 进行重启操作时的处理顺序( priority=high|medium|low )
  6. 设置容量策略,当虚拟机从当前主机移动到主机组中的另一个主机时,自动修改虚拟机的内存和 CPU 资源分配。
  7. 设置虚机分布亲和性策略( Colocation 、 Anti-colocation 、 Blacklist 、 Workgroup )
  8. 设置应用启动顺序。
  9. 设置是否启用 Fibre channel (FC) adapter 的故障检测

丰富的策略设置可以满足各种 HA 管理需求。

VMR HA 如何管理虚机内应用的启动顺序?

VMR HA 中可以使用 ksysvmmgr 命令定义虚机中应用程序的启动顺序,在最新版中甚至可以管理不同虚机中的应用启动顺序。例如,您可能希望先启动数据库,然后再启动使用该数据库的其他应用程序。

另外,您也可以选择是自动重启应用还是手工启动应用。

下图中列举了 VMR HA 1.5 版支持的几种应用从属关系。

KSYS自身的高可用性怎么保证?

KSYS 子系统是 VMR HA 中的一个主要组件,它监视和管理整个环境的运行状况。因此,为 KSYS 子系统设置高可用性将有助于处理 KSYS 守护进程挂起或 KSYS 节点宕机的情况。这种高可用性可以通过使用 PowerHA SystemMirror 软件管理 KSYS 守护进程来设置。( PowerHA SystemMirror 7.2.1 / VM Recovery Manager HA 1.5 )

安装 VMR HA 的软硬件要求是什么?

软硬件要求见下图:

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

2

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广