目前中小银行业做的同城灾备都是以存储级的双活为主要的架构,一主一备,数据通过存储的同步功能进行拷贝,如果发生故障时业务肯定有一段中断时间,业务系统的切换也需要人工干预,这种双活的实际切换时间可能在1~3个小时之间,或者更长; 如何能利用工具或者其他方式方法缩短业务切换的中断时间,使得业务受影响级别降到客户可接受的程度?
基于存储复制的灾备架构因为在背端的盘不可读,需要挂载文件系统,启动数据库等一系列操作,一般容灾切换时间是比较长。想要降低切换时间只能从架构或者流程上着手。
架构调整:
方式一,可采用一些基于存储虚拟化的技术,如vplex,SVC,使得底层存储对于上端透明,在切换过程中可减少甚至免去存储上的操作。
方式二,使用基于DB的复制技术,可大大缩短切换时间
流程调整:
方式一,优化切换流程,通过应用关联分析等方法,加强切换的并行操作
方式二,使用流程工具减少沟通成本,使用切换工具提升切换效率
收起一、规划切换计划,合理规避切换风险。
二、演练切换方案,验证灾备中心可接管性。
三、日常团队培训与实操,流水线规范施工切换。
四、切换方案
1)一般切换涉及通讯线路-内部网络-存储-数据库-服务器-应用-接入应用。
2)灾备架构选择
3)灾备中心之间采用异步复制方式,定期将数据进行复制备份,异步复制支持增量复制方式,可以节省数据备份的带宽占用,缩短数据的备份时间。
4)应用程序开发完整考虑灾备切换的资源配置,比如IP、接入网络。
5)不同业务系统建立不同级别灾备(数据级别、应用级别和业务级别)。
6)自动化工具定期系统健康检查。配合人工关键节点确认。
7)自动化工具主动性维护
收起