目前Power在企业的关键业务系统(如银行支付结算、信贷等)广泛使用,数据库业务占多数,对于这些核心交易系统,业务连续性十分重要,一旦发生故障需要尽快恢复,因此这就要求Power需要具备较好的高可用性。在传统环境,Power高可用主要采用hacmp技术确保双机热备,此外还可以引入LPM动态分区迁移技术,在主机固件升级过程中避免停机,还能和存储、数据库双活进行有机结合。在云环境里,通过PowerVC管理的方式可实现Power的高可用性,其中是否存在着新的挑战?
不知道大家所在的单位现在是如何使用Power高可用技术的?能否满足系统运行需要,RTO多少?
目前的power高可用技术如下:
欢迎大家来讨论一下。
如下架构是我们为某行设计的准生产架构,测试中
除核心系统的核心应用外,其他应用全部去小型机架构,迁入X86
1.部分应用VMware 两套池两个点 F5双活
2.部分核心应用 vios 应用F5双活
3.数据库采用PowerVC+OracleRAC+ADG实现多活 读写分离
4 部分应用采用HDFS加NFS实现文件系统共享
5.核心系统的RTO基本为零,部分MQ采用Veritas 的HA架构,改造中,还无特别有效方案是RTO为零
6.存储底层同步
Power高可用还是挺成熟的,也是全面的。
1、物理Lpar上,我们本地搭了两节点,同城站点搭了一个节点,结合底层两个站点存储级复制,组成PowerHA XD架构,经过实践,RPO=0,RTO一般在1分钟内,存储盘多的最多不超过5分钟。
2、虚拟VM上就更灵活了,有PowerVM虚拟化冗余,也有LPM计划性迁移,还有PowerHA XD架构在PowerVM上的实践。同时利用Power资源池的remote restart技术,实现Power虚拟机的非计划性迁移,保证在Power单计算节点故障后,依旧保持PowerHA XD的完整高可用架构,持续避免数据中心单点。RPO也是0,POWERVM冗余能够保证网卡/光纤卡/VIOS等故障时,丢失几个包,RTO可控制在5秒内。LPM几乎不丢包,RTO控制在1-2秒内。POWERHA XD和物理LPAR环境类似,RTO也能控制在5分钟内,通常就1分钟左右。至于REMOTE RESTART,RTO也不超过5分钟。
目前我们单位采用的是powervc管理,两种oracle数据库版本,存储底层通过svc的hyperswap做镜像卷映射给两台主机,其一是,有应用需要aix环境跑后台程序,双机vioc做powerha,安装oracle11g rac;另一种是无应用后台程序,通过中间件连接,安装oracle12c rac。
管理入口有两个,一是powervc管理;还有一个采用openstack云管平台,调用powervc接口,进行统一纳管。
但可能以后非核心数据库系统,会慢慢向x86过渡。
1.目前大部分数据库服务器及应用服务器均采用PowerHA架构,少量核心服务器采用Powerha+gpfs架构,存储数据方面通过双活存储及snapmirror等手段保证安全性。
2.应用项目升级频率不高,性能上目前可以满足需要。
3.rto在5分钟左右,属于可接受范围内。
我单位采用PowerVC+PowerVM+SVC+gpfs,在计算资源,存储资源、文件系统等方面做的高可用保护。
1、PowerVM,双vios方式当主机硬件出现故障,不影响系统正常使用。
2、IBM SVC启用hyperswap卷,双活存储,防止存储出现故障,数据不可访问。
3、gpfs文件系统防止文件系统出现问题,并且增加IOPS。
4、小机主要用来跑数据库,oracle rac居多,基本不用powrrha。经过4年的使用,基本没有因为物理故障造成的数据库不可访问。
随着power9服务器发布应用,一代一代的power服务器承载着无数企业的核心系统应用,稳定和性能是power服务器的代名词,power之所以稳定与高可用的技术和特性发挥了重要的作用分不开的。
回顾了一下这些年企业应用power服务器与高可用技术的特点:
1 传统Lpar运行,powerha实现应用的本地高可用性 RTO分钟
2 powervm技术 双vios高可用,很多组合场景 vios/powerha vios/npiv+lpm RTO分钟
3 私有云 powervc 1 vios/svc/hmc 2 powervc novalink/sdi
4 站点级别高可用 power+存储复制 MM/GM power+双活技术 SVC/DS8K/GPFS RTO=0
5 VM级别高可用 最新发布的 VM Recovery Manager 此技术其实就是GDR 后续新版本更新了名字从1.3后 VMR DR 新技术最大的特点就是同时具备HA和DR的解决方案 RTO小时分钟