存储网络故障泛滥问题:两个数据中心的SAN网络打通,整合为一张大的SAN网络,可能会因为局部的存储网络故障而波及到整个存储网络,造成重大影响。
通常设计上,不会将两个站点的SAN进行融合,形成两个大的跨站点Fabric。
在做设计时,会要求存储网关节点间,用于传输Cache Mirror和心跳的数据端口,连接到特定的SW或VF/VSAN,然后这些SW或VF/VSAN在两个站点实现连通。
对应大的SAN网络,跨站点的级联,中间的链路故障会导致SAN Reconfiguration,进而引起全网IO pending。
除了通过光纤交换机划分zone进行san网络的逻辑隔离外,还应该按照系统分层结构,对部分san网络做好物理隔离,防止某些前置网络故障影响整个san网络。
收起同意前面专家的观点引入FC Routing,使用LSAN进行隔离。与此同时引入一组边缘交换机用于两个中心之间的连接。
上面的也解答了两点
总结起来就是
1.大的SAN网络用细粒度的zone隔离
2.存储双活的控制节点的通讯SAN网络和其他SAN网络隔离,建立PUBLIC SAN和PRIVATE SAN两种网络
3.核心SAN网络采用“环形”拓扑取代星形拓扑或者线型拓扑
如图:
可以考虑FC Routing,使用Integrated Routing License配合LSAN 使得数据中心的FC网络相对隔离,对需要打通的ZONE配置LSAN ZONE