存储链路稳定性及容错方案分析

字数 1632阅读 3899评论 6赞 21

1. 双活数据库存储复制架构

现在的数据库双活环境部署在马坡和鹏博士机房，属于无偏重的对等双活架构。两机房数据库所用存储通过GPFS实时复制，保证数据一致性，同时提供了双机房并发访问和写入存储的能力（SRDF存储复制只能单边访问）。现有架构如如下：

QQ图片20170912162419.png

其中存储通道是通过物理光纤走波峰设备提供异机房直接访问，属于存储网络二层打通的架构。这种方式保证了存储的访问效率和吞吐量。

2. 现有存储链路稳定性分析

但是之前出现过多次连接双机房的运营商链路抖动，引发了一系列的问题。虽然已经通过使用多家运营商的链路来提高防御能力，但是存储链路抖动还是对应用带来了影响。尤其是部署在数据库双活环境的应用，因为交易量大，所以很容易感知到链路抖动问题。计费系统是最先部署到数据库双活环境的应用，每次存储链路抖动，都会相应的在操作系统看到errpt里面有相关磁盘访问失败的错误，同时查看计费的业务处理时间，当时都执行了40秒左右。

经过和硬件厂商，基础环境运维团队的深入分析，发现操作系统的对磁盘的访问请求超时时间是40秒，对应到当时业务现象也比较吻合。存储厂商分析的原因是链路抖动会导致访问存储的信号丢失，下一次继续访问是由磁盘这个超时机制控制的。但是无论是存储厂商还是硬件厂商，都不建议改小磁盘的超时属性，而且这个属性在现阶段最小也是30秒。

在此基础上，运维团队从数据库使用存储的机制上进一步分析磁盘超时对于数据库业务的影响。数据库存储主要存放数据和日志文件。数据文件是依据一定的策略异步写入存储，所以对存储链路没有那么敏感，不会受到太大的影响。而日志文件是从日志缓存顺序写入磁盘，并且在事务提交的时候必须要等到存储返回写入成功才能算提交完成。所以正是由于日志单并发写磁盘时候遇到链路抖动，需要等待40秒才重新尝试成功，因此事务提交也等了40秒超时才能完成，引发了业务告警。

3. 容错方案可行性分析

因为是日志文件写入存储受到了磁盘访问超时的影响，但是不建议通过调整磁盘超时参数来解决，所以只能考虑绕过磁盘超时这个属性。GPFS是一套非常成熟的分布式存储引擎，可以通过NSD（Net Shared Disk）网络共享的方式提供分布式处理能力。所以我们想到了通过网络访问NSD的方式绕开存储链路，也就避免了磁盘访问超时参数。

对此我们对日志文件存储采用存储链路复制和网络链路复制做了对比性测试。性能测试无论是吞吐量还是响应时间都没有明显差异，而可用性测试的结果差别很大，修改为网络访问模式后，交易受影响的时间从40秒缩短到了4秒！