简单聊一下:
单个系统一致性,可以通过数据复制、数据库同步等技术来保证,只要保证灾备端的数据能正常写回主生产环境,或者如果全部是测试数据,可以直接将灾备环境数据抛弃。
系统间最好不要存在一致性问题,否则不好处理。
回切前要对切换到灾备机房的应用系统进行业务验证,根据提前确定的方案和策略,安排各分支机构或者用户对演练的场景进行业务验证或者真实操作。
业务验证之后,确保生产端设备做好准备,待灾备环境停止和数据回写完成之后,启动生产环境。
只有一点需要特别关注:尽量不要在灾备演练的过程中进行主机房设备重启、维修等运维操作,很可能会导致灾备验证完成之后,主环境设备还没有准备好,造成报备的时间内无法恢复主生产,影响正常营业。
对于回切,只要是真实演练回切与切换需要完成的工作应该是一样的。1、检查数据同步情况,保证数据一直。2、检查容灾与生产环境,保证都处于正确的状态。避免存在不应该不应该挂载的文件系统出现挂的问题。3、然后就正常回切,一般和切换的步骤差不多,只是操作的对象不一样。针对是测试演练的,核对数据同步方向,生产数据覆盖掉测试数据。同时切换业务验证终端的配置到生产环境。
收起针对真实环境的切换演练,一致性主要体现在数据层面,大部分应用本身可以是无状态的。数据主要包括数据库的数据以及nas类的数据。数据库数据的一致性通过主备同步及日志,对于关系型数据库保持强一致性。nas的数据可以通过类似snapmirror这种日常的镜像来同步数据,切换前把主卷写授权禁用,保证数据强一致。
收起灾备回切时保证数据一致性,绝大程度取决于灾备体系的的技术整体架构,与数据的灾备实现方式有很大关系。
一类通过存储层实现灾备保护,通过存储层面实现的数据保护的体系,各业务系统一致性实现起来比较容易,存储厂家对数据一致性绝大多数通过LUN数据一致性组来实现,这种实现方式比较可靠。
通过存储实现的灾备分为存储双活、存储同步复制、存储异步复制。
存储双活架构,优势比较明显,不存在数据一致性问题,两个同城数据中心的两套存储对等,两套存储实时对外服务,数据实时双写到两个存储,存储层无需任何操作,只需要进行上层数据库、应用的切换即可。
存储同步和异步架构,切换时需要将上层业务关闭,存储层角色提升,系统一致性组断开才能保证数据一致性。
一类通过数据库层面、主机层面技术、第三方软件等实现灾备架构,这种情况实现数据一致性是对单个库级别实现,无法保证多个系统数据一致性。
回切期间,数据库方面,一定要正常关闭数据库、正常关闭应用等技术操作,防止存储层切回后数据库数据不一致,数据库无法打开的情况。
收起