这个问题蛮好的,首先介绍一下我们的网络架构:
跨中心的网络首先打通了大二层,两中心间网络通过两中心间波分设备实现级联,网络均互联互通,但波分间的光纤线路需要稳定可靠,冗余度要高,应用跨中心双活,还需保证两中心间网络带宽不能差异太大,否者经常性因两中心间波分设备网络不稳定,造成各类脑裂现象。
你说说的集群分裂(脑裂)可能出现在本地生产机房,也有可能出现在跨中心集群架构当中,有很多种监控手段,比如HA脑裂,只要实施得较好,本地机房基本不存在该现象,网络心跳中断,可通过磁盘心跳判断哪个故障了,是否需要HA切换;跨机房间网络心跳和磁盘心跳均断了,也无需担心,生产两主机间的心跳在,HA会自动将灾备节点关机或者重启,防止发生脑裂,互相争抢资源。监控可监控HA的日志或者操作系统日志,或者监控波分设备。
GPFS跨中心集群的脑裂也一样,生产两节点做为GPFS服务端,灾备两节点做为GPFS客户端,中间网络心跳中断,完全不影响生产两节点的运行。
收起