通过使用多家运营商的链路来提高防御能力,但是存储链路抖动还是对应用带来了影响。尤其是部署在数据库双活环境的应用,因为交易量大,所以很容易感知到链路抖动问题。部署到数据库双活环境的应用,每次存储链路抖动,都会相应的在操作系统看到errpt里面有相关磁盘访问失败的错误
操作系统的对磁盘的访问请求超时时间是40秒,对应到当时业务现象也比较吻合。存储厂商分析的原因是链路抖动会导致访问存储的信号丢失,下一次继续访问是由磁盘这个超时机制控制的。但是无论是存储厂商还是硬件厂商,都不建议改小磁盘的超时属性,而且这个属性在现阶段最小也是30秒。