双中心间通讯不可控问题如何避免?

一是双中心间链路稳定状况不可控;
二是IO延时指标不可控。这些不可控因素非常容易造成灾难性影响,轻则导致数据库读写性能灾难,重则导致数据库节点直接处于僵死状态。另外,链路的不稳定会导致存储链路频繁切换,甚至会导致集群仲裁频繁发生,这对于业务连续性更是一个灾难。

参与10

2同行回答

craziersporecrazierspore产品总监华为
从实际应用角度来看,无论哪种双活,只要到跨中心的层面,就必然需要跨中心的链路作为双活的通讯介质。链路不但要求高可用性和冗余度,同时对通讯质量要求非常高。链路所带来的风险又是巨大的。避免不可控问题要从两方面考虑, 以‘跨数据中心 2 节点 +2 节点双活组网’为例,建议每...显示全部

从实际应用角度来看,无论哪种双活,只要到跨中心的层面,就必然需要跨中心的链路作为双活的通讯介质。链路不但要求高可用性和冗余度,同时对通讯质量要求非常高。链路所带来的风险又是巨大的。避免不可控问题要从两方面考虑,
以‘跨数据中心 2 节点 +2 节点双活组网’为例,建议每个控制器节点都与对端阵列建立 2 条阵列间镜像链路,并对两条链路的交换机进行隔离,获得最高的链路可靠性。

为保证双活性能, 双活链路的网络要求如下:
误码率≤ 10-12e 。
时延 RTT ≤ 1ms 。
无抖动,无丢包。
链路带宽 > 业务峰值带宽,最低要求 2Gbps 。
除了高可靠的组网和链路质量要求外,双活阵列间镜像链路还通常应用传输带宽自适应特性,该技术通过一系列自动检测机制,根据链路质量,动态调整各链路传输占比,减少数据重传率。
例如当前控制器与对端阵列控制器存在两条镜像链路 A 和 B ,当系统检测到链路 A 因为误码等原因存在较大的传输时延时,会根据算法将链路 A 的流控带宽下降 20% ,将更多的带宽压力导向链路 B ,降低链路 A 的带宽压力,从而获得更稳定的传输时延。当链路 A 的传输时延较小时,系统又会根据算法将链路 A 的流控带宽上调 20% ,从而恢复带宽吞吐量。

另外一方面是IO,这一部分一般采用分布式互斥。该能力是实现 AA 双活的关键能力之一,双活分布式锁模块利用 Paxos 和 CHT ( Consistent Hash Table )一致性算法,提供了分布式对象锁和分布式范围锁,从而满足 AA 双活的分布式互斥诉求。通过锁预取技术,可有效减少跨站点的数据传输量和通信交互次数,从而提升 I/O 读写性能。
以主机 I/O 粒度,对主机 I/O 访问的 LBA 区间加分布式范围锁进行并发互斥,从而达到双向实时同步的目的,该方案可省去不必要的阵列间数据传输带宽,并有效的减少数据传输次数。

收起
银行 · 2020-11-19
浏览702
chenmingfuchenmingfu课题专家组基础架构组长西部某城商银行
1.购买dwdm波分设备➕ 租用三大电信运营商(电信➕移动➕ 联通)裸光纤进行跨数据中心之间互联互通,从基础通讯硬件及线路冗余层面提高高可用性2.加强对链路状态的实时监测,一旦发生异常,及时响应查看...显示全部

1.购买dwdm波分设备➕ 租用三大电信运营商(电信➕移动➕ 联通)裸光纤进行跨数据中心之间互联互通,从基础通讯硬件及线路冗余层面提高高可用性
2.加强对链路状态的实时监测,一旦发生异常,及时响应查看

收起
银行 · 2020-11-19
浏览741

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2020-11-16
  • 关注会员:2 人
  • 问题浏览:1244
  • 最近回答:2020-11-19
  • X社区推广