两地三中心双活系统灾备切换场景和数据补录问题?

目前同城双活的架构部署说明如下:1、同城双中心应用采用双活部署,数据库采用ADG复制,两中心的应用实时连接主中心的数据库,当主中心的数据库出现问题切换到灾备中心,应用通过DNS自动解析到灾备中心进行交易。2、主备数据中心分别部署F5负载均衡,应用通过F5 LTM实现应用负载。数...显示全部

目前同城双活的架构部署说明如下:
1、同城双中心应用采用双活部署,数据库采用ADG复制,两中心的应用实时连接主中心的数据库,当主中心的数据库出现问题切换到灾备中心,应用通过DNS自动解析到灾备中心进行交易。
2、主备数据中心分别部署F5负载均衡,应用通过F5 LTM实现应用负载。数据中心内部通过F5 GTM实现内部DNS解析,广域网通过F5 GTM实现双数据中心DNS解析。
3、主备数据中心的网络采用三层架构(未采用二层互通),应用采用不同的网络段地址部署。
对于双活测试需要测试哪些场景?故障切换的场景应该覆盖哪些?对于非计划内的切换,数据丢失的RPO怎么验证,业务数据补录怎么做?

收起
参与42

查看其它 6 个回答zhaijianj的回答

zhaijianjzhaijianj基础架构经理奇瑞捷豹路虎汽车有限公司

1 你个这个架构不是双活吧。如果是ADG的最高保护模式(Maximum Protection)可以做到两边数据完全一样,但是,也是一边读写,一边读。切换的时候重新开库,另一边才可以读写。而且, 最高保护模式(Maximum Protection )会提高生产库的压力。
一般的做法都是最高性能模式(Maximum Performance) 也是一边读写,一边读。 是异步的。RPO肯定不是0 。这比较稳妥不影响生产库。
2 F5做DNS 负载没有问题。问题是,怎么区分写请求 读请求到不同的数据中心?F5做不到的。只能在应用端处理,这个对应用来说也挺难的,除非前期应用就是这么设计的。
3  假设2的问题解决了,ADG  最高保护模式 。也只是一个读写数据中心  一个只读数据中心。停掉一边的F5做 读写测试,停掉另一边做只读测试。
RPO验证就是 写一条数据,看两边是不是都可以查到。两边的时间差就是RPO时间。 如果最高保护模式 那应该是0  最高性能模式会有RPO时间。时间的长短和性能,网络,都用关系。
如果RPO 要求的是5分钟,那丢五分钟的数据是允许的。不用补录数据。RPO=0 就不应该有补录数据的情况。
你这种情况应该用存储双活+跨站点RAC 

汽车 · 2020-03-17
浏览4752
  • 我这边用的最大性能模式,不用读写分离。如果采用extendRAC,怎么保障脑裂问题?
    2020-03-27
  • extendRAC 有磁盘心跳与网络心跳, 磁盘是双活磁盘,这个双活一定要第三站点来保障仲裁; 网络一定 双机房是网络设备双冗余(底层链路是多家运营商光纤保障) Oracle心跳IP 建议选取 2组pri ip。 oracle 通过 磁盘与网络双因素 来投票 仲裁来驱逐节点的。 只要链路不同时出现抖动 还是稳定的。有保障的。
    2020-03-27
  • zhaijianj  zhaijianj回复 summit
    兄弟这么痴迷双活呀。那你就别想ADG了。跨站点的RAC保证不脑裂,这保证不了。只能降低这个风险。vplex 标准架构就有第三仲裁点,所以就存储这块包括仲裁盘,可以降低一部分风险。网络上就个个点都做好冗余,心跳线的设计,数据线的设计,RAC其实是会检测上联网关的。两站点之间的裸纤的质量,延时,冗余,有没有被其他施工单位挖断的风险,要不要选择不同的运营商等。要注意点很多。我的观点是双活不能让基础基础架构硬扛,是可以做到,但你不也操心吗?如果应用系统的架构适合双活,容易实现,或者应用很容易读写分离,基础架构在支撑一下,就更放心更省心。
    2020-03-27

回答者

zhaijianj
基础架构经理奇瑞捷豹路虎汽车有限公司
擅长领域: 云计算容器容器云

zhaijianj 最近回答过的问题

回答状态

  • 发布时间:2020-03-17
  • 关注会员:10 人
  • 回答浏览:4752
  • X社区推广