可靠性上
第一种方案(改良版)比第二种方案的冗余性稍高,但依旧无法解决SAN-A、
SAN-B交换机对各故障一台、数据传输中断的问题。如果想完全杜绝这个问题,就和题主的图一样,第一种方案(全级联),可靠性更高,但可管理性大幅下降,管理出问题的几率远比其他两种方案更大。
负载均衡上
第一种方案(改良版)和第一种方案(全级联)方案都能从两对DWDM走,对链路的利用率更高、压力更小,但第一种方案(全级联)的流量管理更麻烦,要做好细致的策略,也间接增加了运维成本。第二种方案也能够实现链路的负载,只是负载的实现更依赖双活软件,链路上只做好链路该做的事,取得了管理难度和性能的平衡。
管理难度
在管理难度上,第一种方案(全级联)最难,运维管理出错可能性极大,生产环境不推荐这种方案;第一种方案(改良版)管理难度合理,运维中注意规范操作,一般没啥问题。第二种方案,架构简洁,链路清晰,是不错的设计,生产上也有采用这种部署模式的。
续建难度
第一种方案的两种模式扩容都会相对复杂一些,全级联的方式扩容、配置最为复杂,实际中诸多此类
出现故障的案例也不少,随着体量的扩展,管理成本运维成本以及人为操作风险大幅提升。相对而言,改良版的方案,和第二种方案思路会清晰一些,细看之后也会发现改良版方案和第二种方案的设计思想也不谋而合,只是对链路的设计实现方式不一样,一个讲究冗余高效,另一个追求独立简化。
对于双活软件侧,如果链路架构确定了,考虑的事情就相对清晰的多。双活软件上主要的是做好策略控制,包括单点故障应对策略。因此,对于双活层,策略越清晰,越可控可管理,实际运用效果越好。最符合这一点的是第二种方案,链路做好冗余,策略依靠双活软件控制,泾渭分明。
1,如果运维人员实力足够,预算也充足,个人会推荐第一种方案的改良版,无论是可靠性还是可管理性都有不错的实现。
2,如果运维人员较少,对双活的维护倾注不了太多人力物力,第二种方案会是不错的选择,架构清晰,管理简化。
3,即使有人有钱有预算,也不推荐第一种方案(全级联)。在实际项目中,一旦进行全级联,随着体量的增长,管理和成本都是不小的问题,越大越不可控。双活容灾是DC的重要系统,一旦落地,想改架构,难上加难。