xuesong
作者xuesong2022-03-23 13:03
保险行业系统架构师, 浪潮商用机器有限公司

K1 Power支撑金融新型数字基础设施之三:支持多数据中心的多层级高可用&容灾

字数 3378阅读 4939评论 0赞 0

浪潮商用机器有限公司
陈加兴、钟良

人行在《金融科技发展规划( 2022-2025 年)》中提出:按照系统、机房、城市等容灾目标,积极采用多活冗余技术构建高可靠、多层级容灾体系,满足日常生产、同城灾备、异地容灾、极端条件能力保全等需求,提升金融数据中心纵深防御能力,逐步形成高可用数据中心格局。

可以说金融业关系国计民生,维护金融信息系统安全是国家信息安全的重点,因发生灾难导致金融服务中断,可能对企业内部管理、公民、法人和其他组织的金融权益甚至国家金融稳定和秩序产生影响。人行的《金融科技发展规划( 2022-2025 年)》为规范和引导在金融信息系统合理运用容灾技术实现业务承载和灾难恢复,有效防范金融信息系统风险,保护金融机构客户的合法权益制定了标准。

K1 Power 服务器多年来一直致力于为金融客户打造稳定、可靠、高可用的核心业务系统。 K1 Power 架构经过几十年的不断完善,目前已经形成了以 PowerHA 和 VMR 为基础,兼顾关键业务和非关键业务的高可用 / 灾备解决方案。客户可以根据业务需求挑选符合自身业务场景的解决方案,从普通的 PowerHA ,到双活方案,以及两地三中心的方案。 K1 Power 支持从单机到双机到集群的站点内高可靠解决方案,也支持从单站点到多站点、从主备切换到多活部署、从物理节点保护到全局云化虚拟资源池的多方面、多层次的容灾方案,在金融业有大量的使用案例。

(一 ) 单一数据中心高可用方案

PowerHA SystemMirror 为 Power 系统提供高可用管理平台已有二十多年的历史。随着每次发布, PowerHA SystemMirror 变得更强大,更健壮,更易于使用。 PowerHA SystemMirror 解决方案完全满足单站点内的节点高可用,除了实现计划内的资源组切换,还能确保在网卡故障、网络故障、节点故障、节点不稳定或链路抖动故障、计划外场景应用临时故障场景中,实现应用的持续运行或快速恢复。

在虚拟化和云环境中, K1 Power 提供 LPM 分区在线分区迁移技术将运行中的虚机无缝迁移至另一服务器,实现数据零丢失( RPO=0 ),应用几乎无感知( RTO 为秒级)。当出现计划外停机或服务器故障需要进行虚机迁移时, K1 Power 提供 Remote Restart 功能,自动或者手工将虚拟机在资源池中的另一台服务器上进行重启,实现数据零丢失( RPO=0 ),应用在分钟级即可恢复( RTO 为分钟级)。

当数据中心中有大量的虚拟机时, K1 Power 提供 VMR HA 解决方案,在数据中心内构建高可用。 VMR HA 解决方案可灵活制定恢复策略,实现灾难恢复流程自动化,并提供对 Host, VM 和 Application (DB2, Oracle , SAP & POSGRES) 监控,其成本低,部署管理简单,能有效保障业务连续性,实现 RPO=0 ,对计划内分区迁移,实现秒级 RTO ,对计划外分区重启, RTO 为分钟级。

(二 ) 双数据中心容灾方案

PowerHA SystemMirror 企业版提供两个站点之间高可用容灾解决方案 , 可以实现同城 / 异地灾备。 PowerHA SystemMirror 提供多种技术,可以实现远距离数据镜像、故障切换和重新同步。当 PowerHA SystemMirror 检测到一个站点发生故障时,它可以在一个远程站点上将业务重新启动,从而能够快速、自动地采取措施,恢复该应用。这种特性对于必须保护自己避免出现站点间故障或大规模灾难的金融客户来说,是至关重要的。当两个站点之间的距离 <100KM 时,可以实现同步数据复制,其 RPO=0 ;当两个站点之间的距离 >100KM 时,采用异步数据复制。

对于采用 K1 Power 虚拟化和云环境的金融客户,可以采用 VMR DR 解决方案,在两个数据中心间(无距离限制)构建容灾,管理大量的虚拟化分区。它的优势在于跨地域的容灾保护,保障数据一致性、业务连续性,可灵活制定恢复策略,灾难恢复流程自动化,不影响生产的容灾恢复测试,并且成本低,部署管理简单。

(三 ) 双活容灾方案

同城双活中心的解决方案旨在为最关键的应用提供更加完备和卓越的关键业务连续高可用性 (Continuous Availability) 。同时可以充分利用第二个站点的实时数据资源,挖掘信息的业务价值,拓展业务创新能力,其恢复时间目标 (RTO) 和恢复点目标 (RPO) 近乎为零。 K1 Power 提供多种双活容灾方案,包括主机 / 存储高可用及双活一体化方案 HyperSwap 、存储双活方案 ORACLE RAC+G2 InMetro 、集群文件系统双活方案 Oracle RAC+GPFS A-A 等。其方案优势在于:减少关键应用的计划内停机(包括系统变更、例行维护等)、减小关键应用的计划外停机(包括关键应用或者系统的逻辑故障所带来停机、遭遇站点级别非计划故障等)、充分利用两站点资源,充分利用和挖掘第二个站点上近乎实时的“核心生产数据”的价值,创新更多分析型业务支持能力。

(四 ) 两地三中心容灾方案

数据中心两地三中心架构的设计源于银行 IT 系统集中后对业务连续性的需求。两地三中心的架构比较好的满足了各种严重故障情况下的系统高可用性要求。 PowerHA SystemMirror 针对两地三中心灾备建设的需求,结合 Power 的硬件优势,提供了典型的解决方案,该解决方案在所有服务器上安装 PowerHA SystemMirror 企业版,在本地生产中心的 DS8000 存储相应的业务数据,通过 Metro Mirror 数据同步复制技术将数据复制到同城灾备中心的 DS8000 ,可以实时保证数据的一致性。同时位于同城灾备中心的 DS8000 的同一份数据可以同异地远端的 DS8000 通过 Global Mirror 数据异步复制技术进行数据镜像,实现异地的数据备份及保护。当同城灾备中心发生故障时,生产中心的 DS8000 可以向异地灾备中心的 DS8000 通过 Global Mirror 数据异步复制技术同步数据,实现异地的数据备份及保护。 PowerHA SystemMirror 两地三中心容灾解决方案优势:

  • 同城范围镜像数据可以不丢失;
  • 异地镜像数据根据灾难情形,尽可能降低数据丢失机率;
  • 镜像网络中断恢复后,任意两站点之间可以通过增量方式实现再同步,无需重传;
  • 生产中心应用系统响应时间只受本地的两个中心的距离影响;
  • 同城 RPO=0 ,异地 RPO 最短 3-5 秒,无距离限制,保证数据一致性,且可故障切换;
  • 带宽要求低,先进的复制机制提高带宽利用率;
  • 充分利用同城灾备中心的设备, DS8000 的 FlashCopy 的数据可用于系统查询、批处理、测试。

(五 )K1 Power 从软硬件提供全方位隐私保护

数据保护不光需要支持在应用层进行数据加密,以及数据传输加密等常规的保护。 在硬件方面从底层操作系统本身的安全性,到虚拟化软件本身的安全漏洞,到数据在内存中的加密都需要加入考虑来保证用户数据的安全性以及隐私性。

对于本地磁盘 / 远程存储中的数据, K1 Power 服务器支持逻辑卷的加密,保证数据不会从存储中被窃取。不仅如此, K1 Power 最新一代的服务器支持透明的内存加密,同时对服务器的性能没有任何影响。在恶意用户想要通过内存 dump 来获取隐私数据的情况下,提供了更多一层的保护,杜绝了此类数据窃取的发生。

在操作系统层, 浪潮商用机器安全的操作系统可以防止恶意用户获取访问权限。对于外部想要入侵操作系统的恶意用户来说,安全的操作系统可以防止其进入系统,而窃取用户数据的数据。同时,对于内部恶意人员想要获取更高权限的情况下,我司安全的操作系统可以阻止此类操作,禁止其获得非必要的用户数据的访问,从而保护用户数据的私密性。

在虚拟化 / 容器层,虚拟软件本身存在的漏洞或是未及时修补的 bug 非常容易被黑客进行利用,从而获取到访问权限以外的数据。我司的虚拟化软件持续多年保持 0 漏洞的记录,保障用户的数据安全。

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

0

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关文章

相关问题

相关资料

X社区推广