保险公司核心系统载有客户信息、保单信息、理赔事务信息等大量机密数据,万一发生系统故障,如何及时应对?或核心系统如何数据进行容灾备份?
收起如何快速应对核心系统故障,需要从技术,人员,流程三个方面统一进行考虑:
(1)技术上,由于故障的种类非常多,需要在架构上考虑采用多种技术并用以应对不同类型的故障,包括不同类型的本地高可用技术(应用集群,主机HA,虚拟化,数据库高可用,本地存储双活等)应对单节点故障,连续数据保护技术和备份技术应对逻辑性故障,不同类型的容灾技术(跨中心数据复制,应用容灾,跨中心负载均衡等)应对机房级或区域级灾难等。
(2)人员上,需要考虑日常运维组织架构的建设,包括配备7*24监控值班人员,一、二、三线技术人员以及外部技术专家等组成的运维组织体系;以及应急组织架构体系的建设,包括应急领导、指挥及执行团队人员的建设,以确保核心系统故障能够快速进行定位和处理
(3)流程上,需要制定核心系统的生产应急预案和灾难恢复预案,构建一体化且可执行的预案体系,确保能够结基于故障类型,采用最合适的故障处置策略,快速恢复业务。