尝试根据我的经验从管理与技术两个方面进行:1.管理1)应用版本/基础架构版本(如系统/数据库/中间件参数等)保持一致2)人员团队能力灾备配置可弱一些,但必须有人3)定期的实战演练,如半年一次,可由灾备方主导4)统一的应急制度与策略,包括入口、过程控制和报告机制2.技术1)根据不同业务系...
显示全部尝试根据我的经验从管理与技术两个方面进行:
1.管理
1)应用版本/基础架构版本(如系统/数据库/中间件参数等)保持一致
2)人员团队能力灾备配置可弱一些,但必须有人
3)定期的实战演练,如半年一次,可由灾备方主导
4)统一的应急制度与策略,包括入口、过程控制和报告机制
2.技术
1)根据不同业务系统对RTO/RPO的需求制定灾备的技术方案,主要在于数据同步的方式有所区别
如存储级同步/异步、数据库级同步/异步、应用级同步/异步,对一致性要求极高(如银行帐务系统)使用同城同步、异地异步的方式
2)有全自动的故障判断方式与切换系统
该系统一般独立部署,通过业务成功率、业务量、服务器状态、应用状态等维度进行组合判断,并发起切换指令,通过网络隔离/应用重建链等方式尽心应用切换
3)有自动数据比对系统
绝大部分灾备场景下源站数据是存在的,因此可设计自动数据比对数据,对两边的数据进行数据比对并追补
收起