SDN控制器集群的故障检测和故障处理的流程是什么?

是否在整个故障/恢复过程中,只有控制器管理层面进行相关监测和操作,对于已有的转发不构成任何影响,是否可以保证零丢包?对于恰好在故障切换过程中新建的流表,尽可能做到极少量丢包,可忽略不计?

参与9

2同行回答

windfengwindfeng系统分析师华为
Agile Controller-DCN集群系统提供自动容灾能力。管理员可以配置心跳超时个数、心跳间隔、心跳超时后多久进行倒换的时间。当主集群故障,备集群接收心跳超时后会触发告警,同时达到配置的倒换时间后如果心跳还未恢复则会自动备升为主接管业务。当心跳中断时,如果主备两边集群...显示全部

Agile Controller-DCN集群系统提供自动容灾能力。管理员可以配置心跳超时个数、心跳间隔、心跳超时后多久进行倒换的时间。当主集群故障,备集群接收心跳超时后会触发告警,同时达到配置的倒换时间后如果心跳还未恢复则会自动备升为主接管业务。当心跳中断时,如果主备两边集群都是正常工作状态,此时备会认为主故障,心跳超时后备升主。但此时主并没有故障,则形成了双主集群。双主集群对业务有影响,此时都会操作业务数据,造成业务数据不一致,甚至影响已有业务。这种情况称之为脑裂。为防止脑裂,华为部署了仲裁节点,用于心跳断链时进行仲裁,两个集群申请仲裁,决定主备。容灾倒换的过程中不影响已有转发面,但是新业务处理不了。

收起
软件开发 · 2018-11-29
浏览2499
yuanruxuyuanruxu系统运维工程师中国银联
控制器故障后对现有网络通信不会有影响,可以做到不丢包。至于恰好在故障切换过程中新建的流表,我感觉如果真的这么赶巧的话,是无法新建流表的,这个时候变动的节点应该是无法通信的,直到控制器切换动作完成之后,才能有新的流表下发下来。...显示全部

控制器故障后对现有网络通信不会有影响,可以做到不丢包。至于恰好在故障切换过程中新建的流表,我感觉如果真的这么赶巧的话,是无法新建流表的,这个时候变动的节点应该是无法通信的,直到控制器切换动作完成之后,才能有新的流表下发下来。

收起
金融其它 · 2018-11-29
浏览2418

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2018-11-27
  • 关注会员:4 人
  • 问题浏览:3561
  • 最近回答:2018-11-29
  • X社区推广