当架构变得越来越庞大和复杂的时候。虽然整个架构是为了高可用而搭建的。但往往还没有等到单点出现问题。却因为维护和业务迁移等问题导致整个架构的崩塌。
我觉得的搭建异地双活这样高大上的架构,首先要对整个架构,技术有充分的了解。特别是运维人员。要了解所有的技术细节,,其次是定期巡检。并且仔细检查每一个日志和细节。不要因为线路松动,磁盘故障等小问题造成整个系统的崩塌。
定期演练,虽然现在很少有公司这样做。因为每一次演练的风险都很高。但其实这是为了让问题更早的暴露在我们可控的范围内。而不是出现在我们没有准备的时候。
异地双活中心是非常考验管理能力的,因为异地会导致环境、风俗和操作习惯的差异,但是双活中心要做到真正能够平滑切换,必须保证服务保障团队的服务一致性,目前看异地双活中心非常有必要纳入生产一体化管理。这种一体化管理,不仅要有统一的规章制度、还要有统一的工具、统一的管理风格,条件允许的情况下两个中心的人员交换工作一段时间对于彼此熟悉和保障双活的平稳切换都是有帮助的。
不过如果人手不足,就看能不能通过一些工具弥补。巧妇难为无米之炊,如果连厨子都没有只是靠远程维护,对于双活数据中心比个人认为风险比较大。