关于集群的分裂该如何监控并进行有效预防?

关于集群的分裂该如何监控并进行有效预防?

参与10

3同行回答

jxnxsdengyujxnxsdengyu课题专家组系统工程师江西农信
这个问题蛮好的,首先介绍一下我们的网络架构:跨中心的网络首先打通了大二层,两中心间网络通过两中心间波分设备实现级联,网络均互联互通,但波分间的光纤线路需要稳定可靠,冗余度要高,应用跨中心双活,还需保证两中心间网络带宽不能差异太大,否者经常性因两中心间波分设备网络不稳定...显示全部

这个问题蛮好的,首先介绍一下我们的网络架构:

跨中心的网络首先打通了大二层,两中心间网络通过两中心间波分设备实现级联,网络均互联互通,但波分间的光纤线路需要稳定可靠,冗余度要高,应用跨中心双活,还需保证两中心间网络带宽不能差异太大,否者经常性因两中心间波分设备网络不稳定,造成各类脑裂现象。

你说说的集群分裂(脑裂)可能出现在本地生产机房,也有可能出现在跨中心集群架构当中,有很多种监控手段,比如HA脑裂,只要实施得较好,本地机房基本不存在该现象,网络心跳中断,可通过磁盘心跳判断哪个故障了,是否需要HA切换;跨机房间网络心跳和磁盘心跳均断了,也无需担心,生产两主机间的心跳在,HA会自动将灾备节点关机或者重启,防止发生脑裂,互相争抢资源。监控可监控HA的日志或者操作系统日志,或者监控波分设备。

GPFS跨中心集群的脑裂也一样,生产两节点做为GPFS服务端,灾备两节点做为GPFS客户端,中间网络心跳中断,完全不影响生产两节点的运行。

收起
银行 · 2016-08-12
浏览2413
xingfarxingfar系统架构师大连银行
生产中心ha若网络心跳和磁盘心跳都断了,如何解决?显示全部

生产中心ha若网络心跳和磁盘心跳都断了,如何解决?

收起
银行 · 2016-08-16
浏览2310
舒天楚舒天楚CIO乌海银行
谢谢,这样一说我就理解了。显示全部

谢谢,这样一说我就理解了。

收起
金融其它 · 2016-08-12
浏览2171

提问者

舒天楚
CIO乌海银行
擅长领域: 系统管理服务器脑裂

问题来自

  • 相关问题

    相关资料

    相关文章

    问题状态

  • 发布时间:2016-08-12
  • 关注会员:3 人
  • 问题浏览:6121
  • 最近回答:2016-08-16
  • X社区推广