SDN控制器集群的故障检测和故障处理的流程是什么?

是否在整个故障/恢复过程中,只有控制器管理层面进行相关监测和操作,对于已有的转发不构成任何影响,是否可以保证零丢包?对于恰好在故障切换过程中新建的流表,尽可能做到极少量丢包,可忽略不计?...显示全部

是否在整个故障/恢复过程中,只有控制器管理层面进行相关监测和操作,对于已有的转发不构成任何影响,是否可以保证零丢包?对于恰好在故障切换过程中新建的流表,尽可能做到极少量丢包,可忽略不计?

收起
参与9

查看其它 1 个回答windfeng的回答

windfengwindfeng  系统分析师 , 华为

Agile Controller-DCN集群系统提供自动容灾能力。管理员可以配置心跳超时个数、心跳间隔、心跳超时后多久进行倒换的时间。当主集群故障,备集群接收心跳超时后会触发告警,同时达到配置的倒换时间后如果心跳还未恢复则会自动备升为主接管业务。当心跳中断时,如果主备两边集群都是正常工作状态,此时备会认为主故障,心跳超时后备升主。但此时主并没有故障,则形成了双主集群。双主集群对业务有影响,此时都会操作业务数据,造成业务数据不一致,甚至影响已有业务。这种情况称之为脑裂。为防止脑裂,华为部署了仲裁节点,用于心跳断链时进行仲裁,两个集群申请仲裁,决定主备。容灾倒换的过程中不影响已有转发面,但是新业务处理不了。

软件开发 · 2018-11-29
浏览2473

回答者

windfeng
系统分析师华为
擅长领域: 网络云计算私有云

windfeng 最近回答过的问题

回答状态

  • 发布时间:2018-11-29
  • 关注会员:4 人
  • 回答浏览:2473
  • X社区推广