DR 测试人人都在做,巧妙也各自不同,怎样才能算是「正确」的方式呢?笔者认为,至少要先能够避免以下5点容易犯的错误,才不至于让平日辛苦的DR测试工作,最后都变成在作白工。
1)不完整的DR设定或不足够的DR资源:几乎大多数的公司都会犯上这样的毛病。明明就期望DR Site能够在Production Systems出状况时成功地接手进行Failover,而且RPO (Recovery Point to Object)和RTO (Recovery Time to Object)期望又其高无比,但分配给DR的资源却与Production天差地远。试想,贵公司系统出状况时,分配给DR Site的内存与CPU,真的足以撑起整个Production Load吗?
2)不同RDF群组所导致的数据复制不一致:在需要复制群组(Remote Data Facility, RDF)的大型EMC SRDF/S与SRDF/A环境中,特别容易产生这种状况,因为当不同的RDF群组同时提供储存容量给主机,并且被相同的数据库使用时,每个RDF群组都会对应不同的复制接收器与(或)网络基础架构,并产生不一致的复制数据。每次关闭应用程序、数据库或是主机时,或多会少都会让这些数据处于不一致的状况之下。