增加SVC意味着增加一个风险点。如果SVC出现一台问题,对整个业务系统的影响有多大?如果SVC两台均出现问题,影响又如何?应对措施是什么?
同意楼上两位的说法,没有不回发生故障的设备,这里我在补充一下;
第一,SVC节点故障,另外一个节点可以接管;
接管过程需要有io短暂挂起,但不致于不能用;目前还没有这样的影响生产的案例;
第二,日常的监控,故障的预警;
日常要健康svc节点的性能使用情况,提前作出合理的调整;另外通过事件预警,也可以手工的介入;
如果是同IO group中的一个svc节点宕机,我们在测试环境上的测试数据是影响上层应用vmware集群hang住10s左右,但不会有数据不一致发生。虚拟机将会正常运行。如果同IOgroup中两个svc节点同时宕机,势必造成该组所属的vdisk均无法被上层访问,需要手工迁移大cluster中其他的group。
收起