灾备演练时,多个系统的依赖关系会发生变化,系统多的话关系数量可能成指数上升,实在是管不过来。请问什么工具或方案可以管理系统间依赖关系,或者简化系统间的依赖关系?最好是能够实现根据服务可用性自动切换。
依赖关系正常应该由CMDB进行统一管理。
网络大二层打通可以解决部分同城演练的依赖问题,每套系统都可以单独切换。但是同城非大二层打通和异地切换要考虑强依赖问题。
原则上,最好不要强依赖,实在要依赖的话就要保证每次都一起切换,作为一个逻辑统一体。
灾备演练的流程要实现场景驱动,确定好灾备演练的系统和演练场景,从CMDB中读取依赖信息,哪些系统应该随之切换,自动进行提醒和选择,按照这些系统和场景自动化生成流程。这些在桌面演练时就可以进行操作和验证。
千万不要使用预生成的流程,无法应对千变万化的场景,无法应对日渐增加的灾备系统梳理,更无法应对灾备系统的变更。
管理系统依赖,需要清楚知道一个系统的逻辑部署架构图,从架构图中体现系统之间的依赖关系。但是,如果系统太多,手工维护会变得非常困难。如果能借助arms的工具,加上与cmdb进行对接,动态维护应用链路及系统依赖,在切换的时候从cmdb获取存在系统依赖关系的最小切换单元,能减少维护成本以及提升切换的成功率。
收起