越是庞大的系统。容灾演练中不确定的因素也会越多。
1,涉及到的业务过于复杂,维护人员众多。要仔细梳理所有演练中可能会影响的模块
2切换时间超出预算时间,无法正常恢复业务,比如数据拷贝,意外的线路影响,设备老化出现的意外宕机都会让演练出现意外而导致无法继续进行,
3,业务部门无法接受过长时间的业务中断,不得不迁就业务而修改预案演练的计划,一个无意中的修改就有可能出现意外
4,业务切换,数据切换特别是异地切换,由于运营商的线路维护,线路意外而导致网络中途中断。
应急预案的演练我想更多要做的并不是对于机器,架构的演练,而是对于整体协调的演练。这个协调更多的包括是人。一次大型的应急预案演练。要充分的演示到所有的岗位人员协同工作。而不仅仅是IT运维人员。相关的业务负责人,设备负责人等等都要在预案中有所考虑。保证突发事件发生,可以在最快的时间又最合适的人在最合适的岗位解决他所负责的问题。
收起