目前Power在企业的关键业务系统(如银行支付结算、信贷等)广泛使用,数据库业务占多数,对于这些核心交易系统,业务连续性十分重要,一旦发生故障需要尽快恢复,因此这就要求Power需要具备较好的高可用性。在传统环境,Power高可用主要采用hacmp技术确保双机热备,此外还可以引入LPM动态分区迁移技术,在主机固件升级过程中避免停机,还能和存储、数据库双活进行有机结合。在云环境里,通过PowerVC管理的方式可实现Power的高可用性,其中是否存在着新的挑战?
不知道大家所在的单位现在是如何使用Power高可用技术的?能否满足系统运行需要,RTO多少?
目前的power高可用技术如下:
欢迎大家来讨论一下。
Power高可用还是挺成熟的,也是全面的。
1、物理Lpar上,我们本地搭了两节点,同城站点搭了一个节点,结合底层两个站点存储级复制,组成PowerHA XD架构,经过实践,RPO=0,RTO一般在1分钟内,存储盘多的最多不超过5分钟。
2、虚拟VM上就更灵活了,有PowerVM虚拟化冗余,也有LPM计划性迁移,还有PowerHA XD架构在PowerVM上的实践。同时利用Power资源池的remote restart技术,实现Power虚拟机的非计划性迁移,保证在Power单计算节点故障后,依旧保持PowerHA XD的完整高可用架构,持续避免数据中心单点。RPO也是0,POWERVM冗余能够保证网卡/光纤卡/VIOS等故障时,丢失几个包,RTO可控制在5秒内。LPM几乎不丢包,RTO控制在1-2秒内。POWERHA XD和物理LPAR环境类似,RTO也能控制在5分钟内,通常就1分钟左右。至于REMOTE RESTART,RTO也不超过5分钟。
随着power9服务器发布应用,一代一代的power服务器承载着无数企业的核心系统应用,稳定和性能是power服务器的代名词,power之所以稳定与高可用的技术和特性发挥了重要的作用分不开的。
回顾了一下这些年企业应用power服务器与高可用技术的特点:
1 传统Lpar运行,powerha实现应用的本地高可用性 RTO分钟
2 powervm技术 双vios高可用,很多组合场景 vios/powerha vios/npiv+lpm RTO分钟
3 私有云 powervc 1 vios/svc/hmc 2 powervc novalink/sdi
4 站点级别高可用 power+存储复制 MM/GM power+双活技术 SVC/DS8K/GPFS RTO=0
5 VM级别高可用 最新发布的 VM Recovery Manager 此技术其实就是GDR 后续新版本更新了名字从1.3后 VMR DR 新技术最大的特点就是同时具备HA和DR的解决方案 RTO小时分钟
虚拟化环境 : LPM(在线分区迁移)
PowerHA(同站点) :本地高可用方面非常可靠,从2007年使用以来,没有出现发生业务故障时切换不成功的案例。日常维护中,维护的工作量很小,每年进行手工的切换演练,防止发生业务变动时, PowerHA的配置没有及时更新,造成业务切换失败的情况。