无论是任何一种产品都可以配置成自动切换,主要是根据风险程度去决定是否进行自动化配置。但是可以逐渐去实现自动切换,而且不是开始就是自动化切换,对于应用、中间件、数据库等启动都可以自动化,但是涉及存储的虽然有可以自动化,为了安全可以前期先手工切换。制定了完备检查方案后,再纳入到自动切换中。
收起个人觉得这个问题要考虑对这些操作的把控程度,基本上没有操作不能自动化实现。
我们采用的是同城网络大二层打通,存储复制技术(SWAP和STAR模式)实现的大同城小异地的灾备方案, 要进行网络设备、操作系统、数据库、中间件、监控、应用、存储等操作。
无论是主备机房同一个服务IP的方式(要增删服务IP和重新apply集群),还是DNS方案(流程中需要更改DNS服务器中的指向),以及外联只允许一个IP通过防火墙的特殊情况等等,都实现了自动化操作。
建设初期,我们就实现了除同城演练存储SWAP回写步骤之外的所有自动化,只是担心存储回写步骤出现问题导致在同城灾备端通过各种渠道写入的真实业务数据被抹掉而采用了人工操作,经过数次演练验证之后,现在也实现了全自动化操作。
目前,整个灾备演练流程,只有切换流程第一步“确定能否演练切换”和中间的“业务验证”,是人工操作,其他全部自动化操作。