双活系统本身是为了解决物理上的错误的,例如曾经发生过的某个机房被水淹,火烧,或者光缆故障等。
而逻辑上的错误本身很难保证业务的完全连续性,通常会需要一个恢复过程,例如操作员误删除了一个表等。
两种错误都有可能发生,但用于管理这些错误的方式是不同的。
第一种错误通常可以通过组建双活,高可用,容灾等方案预防,从而将损失减到最小。
而第二种错误则分为两个部分
1. 从技术上来说,可以通过快照,或者基于数据库的方式,进行数据库/文件系统的日备,周备,月备,并且备份的目的端除了需要在线系统外,重要的东西可能还需要备份到离线系统上,例如磁带,从而防止被破坏
2. 从管理上来说,一个运维的操作步骤,权限控制,病毒/网络等防护机制都是必不可少的。
因此业务连续性是一个复杂的工程,而不是一个简单的技术。此外处理上述的内容,日常的操练与验证也是必不可少的环节。可以想象,一年没有操练过的切换/恢复流程,能在问题发生时把数据快速的还原出来的可能性低于10%。