在容灾链路发生抖动或者是链路频繁断开又恢复的情况下如何保证存储双活的稳定?
收起网络抖动问题 ,主要是提前预防,其次是快速隔离。
我行目前经验(博科品牌):故障预防及快速隔离
1、交换机端API收集端口报错信息,利用开源工具Grafana进行TOP排行展示,针对前5名进行邮件通知排障,提前预防;
2、交换机端API收集端口收发光以及对端收发光(部分型号终端不支持),针对不同速率设置阀值(比如16GB>=250uw;32GB >=300uw),有条件进行提前预更换,防止临界故障点出现,提前预防;
3、交换机上FOS支持Maps策略,根据企业实际需要启用相应的策略(分4个等级:激进、中等、保守、基本),针对上述告警进行fence禁用,及时自动隔离抖动故障。