存储双活对同城数据中心的选址要求?双活存储间链路的可靠性和稳定性对系统的影响及应对方案?

存储双活对同城数据中心的选址要求,如何选择同城两地数据中心的距离?双活存储间链路的可靠性和稳定性对系统的影响及应对方案?

参与16

2同行回答

chenmingfuchenmingfu课题专家组基础架构组长西部某城商银行
  1.跨数据中心通讯链路方面   购买波分设备,波分设备具备冗余高可用性,租用运营商的裸光纤,作为通讯的链路。裸光纤也冗余。裸光纤通常租用两家或两家以上的运营商线路,比如电信、联通和移动,电信的裸光纤也需要冗余,联通的裸光纤也需要冗余,防止单根裸光纤意外割断或者损...显示全部

  1.跨数据中心通讯链路方面
  购买波分设备,波分设备具备冗余高可用性,租用运营商的裸光纤,作为通讯的链路。裸光纤也冗余。裸光纤通常租用两家或两家以上的运营商线路,比如电信、联通和移动,电信的裸光纤也需要冗余,联通的裸光纤也需要冗余,防止单根裸光纤意外割断或者损坏。
    然而单家运营商的裸纤都通常在一个弱点井中,一起意外割断的事情常有,所以需要两家运营商互相冗余。这两家运营商裸纤的路线还不能一致,弱电井需要在不同的街道,并且分别走不同的路线到达目的地。

  2.通讯链路质量方面

    链路质量包括光衰、抖动和带宽等。一方面,光衰和抖动无法控制,只能靠波分设备去探测,发现光衰和抖动,立即中断该链路,切向备链路,这对后端的 SAN 网络无感知,但对波分设备的要求很高,需要购买和建设时注意。至于带宽,可以监测,达到带宽预警阈值后,可向运营商申请提升带宽。另一方面,对于链路质量的监测机制一定要在建设存储双活或者其他双活之前建立,由于是运营商的链路,链路经过了多少中继、多少设备我们是不得知的,我们只能在波分端建立有效的监测机制,有些波分设备也有专门的监控软件支持。而且也要要求和运营商建立监测联动机制,运营商监测到链路质量(是质量而不是中断)有问题,也需要第一时间告知,做出合理的决策。

  3.存储双活控制器的机制

    由于跨中心的双活控制器间的通讯是实时的,完整写周期必须两个站点的控制器都完成写操作。他们间的通讯又是靠链路完成的,链路质量和链路中断都将导致性能波动甚至超时,对于中断,控制器的处理机制都还不错,对于质量,控制器的处理机制往往不够,需要长时间的尝试,才会做出合理的决策,甚至没有决策, 导致上层数据库或者应用磁盘 IO 超时,而异常挂起甚至宕机。所以这个机制是决定好的双活体系的重要因素,有时候宁可立即放弃一边,也要保住 RTO。

  4.存储上层 OS、应用和数据库合理的超时参数
  OS 识别磁盘、应用访问文件系统、数据库访问裸设备或者文件系统,存储 IOHANG 住,将导致层层超时,尤其是数据库,超时将彻底中断宕机,甚至出现逻辑损坏等莫名奇妙的问题。有时候超时响应慢是可以等,而不是中止,所以需要OS、数据库层进行合理的超时联动设置
 5.尽量避免跨站点读写频率
 没有跨站点读,就意味着本地可读,对链路质量没有要求;减少跨站点写频率, 就意味着,性能影响弱化,被控制器、数据库、操作系统等层层缓存暂存的写数据,会减少跨站点写的次数,进一步弱化链路质量所会带来的影响。没有跨站点读,就意味着本地可读,对链路质量没有要求;
收起
银行 · 2020-11-17
浏览1822
基础设施的架构设计取决于上层应用架构的设计,同城数据中心的选址需要结合应用TIMOUT设计和规划,然后选择适当的距离。双活架构通常会采用仲裁机制,也就是由仲裁盘,如果链路稳定性不好,经常发生超时的现象,就有可能造成双活数据不断地仲裁,严重时可能会发生脑裂的现象。因此建议...显示全部

基础设施的架构设计取决于上层应用架构的设计,同城数据中心的选址需要结合应用TIMOUT设计和规划,然后选择适当的距离。
双活架构通常会采用仲裁机制,也就是由仲裁盘,如果链路稳定性不好,经常发生超时的现象,就有可能造成双活数据不断地仲裁,严重时可能会发生脑裂的现象。因此建议双活数据中心之间的距离不要太远,其次选择信号稳定的电信运营商,最好是多家运营商共同来保证链路的冗余。

收起
IT咨询服务 · 2020-11-19
浏览1836

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2020-11-09
  • 关注会员:3 人
  • 问题浏览:3533
  • 最近回答:2020-11-19
  • X社区推广