在灾备双活或多活架构中,多系统切换中发生脑裂如何判断并解决的?

背景:灾备体系建设,双活或多活架构
环境:小型机和x86平台,高端存储vmax200,中端存储vnx5500等,数据库db2
现场信息:距离100公里,裸光纤
思考:在灾备双活或多活架构中,多系统切换中发生脑裂如何判断并解决的?
难点:发生站点级别灾难的自动判断依据?

3回答

njtukangnjtukang  项目总监 , 股份制商业银行
半夏蒲公英ydz110yinxin等赞同了此回答
1、脑裂主要一般说的是一些部件高可用协议层面,两个节点同时认为自己为主节点。在双活架构下,一般数据中心级别切换一般需要人工介入,全部自动化触发同城切换的案例我还没有见到(一方面监控主要、切换工具自身可能存在故障或者误判,并且概率较发生数据中心故障更高。第二,切换...显示全部

1、脑裂主要一般说的是一些部件高可用协议层面,两个节点同时认为自己为主节点。在双活架构下,一般数据中心级别切换一般需要人工介入,全部自动化触发同城切换的案例我还没有见到(一方面监控主要、切换工具自身可能存在故障或者误判,并且概率较发生数据中心故障更高。第二,切换过程也包含风险,切换在部分环节需要人工介入)。人工条件下,一般不存在脑裂,是由人工指定主节点,备节点。在人工介入情况下,确实需要保证故障节点不再承载交易,不然会出现数据紊乱。一般可考虑从源头上封禁导向故障节点的流量,也可尝试在故障节点进行关机操作,但是不一定能够成功。
2、站点级建议从业务交易角度判别,因为技术故障场景很多,对于业务的影响也难以第一时间判断。其次,为了防止业务监控的误判,也独立增加一套独立的监控手段,或者可以通过收集客户反馈进行辅助验证。但是全面、快速、准确的业务影响还是依靠监控,一般业务反馈需要时间,汇总,分析以及精准度问题

收起
 2019-05-23
浏览696
梅志荣梅志荣  技术总监 , 北京协力友联
yinxin赞同了此回答
双活或者多活架构下,当发生数据链路问题时,需要第三方仲裁站点提供脑裂解决方案,通过第三方站点判断是站点间链路问题?还是确实是某个站点发生了灾难。第三方仲裁站点通用的方法是采用仲裁主机,各站点通过iscsi或者其他方式获取仲裁设备。个人不建议采用自动方式判断站点级灾...显示全部

双活或者多活架构下,当发生数据链路问题时,需要第三方仲裁站点提供脑裂解决方案,通过第三方站点判断是站点间链路问题?还是确实是某个站点发生了灾难。第三方仲裁站点通用的方法是采用仲裁主机,各站点通过iscsi或者其他方式获取仲裁设备。
个人不建议采用自动方式判断站点级灾难,毕竟站点级灾难发生的几率不大,而且决策因素较多,灾备应用软件再怎么智能也不能赋予它决策的功能,否则发生误操作,站点上的业务系统切来切去,搞出的事情就不是简单丢数据了。
个人建议,仅供参考!

收起
 2019-05-24
浏览588
aixchina 邀答
asdf-asdfasdf-asdf  研究学者 , cloudstone
yinxin赞同了此回答
在灾备双活或多活架构中,多系统切换中发生脑裂如何判断并解决的?需要第三方进行仲裁, 发生站点级别灾难的自动判断依据?多级监控判断, 或者人为预警了显示全部

在灾备双活或多活架构中,多系统切换中发生脑裂如何判断并解决的?
需要第三方进行仲裁,
发生站点级别灾难的自动判断依据?
多级监控判断, 或者人为预警了

收起
 2019-05-23
浏览680

提问者

m1983j系统架构师, hrbb

问题状态

  • 发布时间:2019-05-21
  • 关注会员:6 人
  • 问题浏览:3257
  • 最近回答:2019-05-24
  • 关于TWT  使用指南  社区专家合作  厂商入驻社区  企业招聘  投诉建议  版权与免责声明  联系我们
    © 2019  talkwithtrend — talk with trend,talk with technologist 京ICP备09031017号-30