理论上说,最低配置是奇数个,也就是3个。
如果是3副本,且发生节点故障时候,需要考虑以下几个方面。
1、多副本:同一份数据会保存多份(通常设置为 2 副本或 3 副本),即使副本所在的节点宕机也不会造成数据丢失;
2、HA(高可用):节点宕机时,该节点上的虚拟机自动迁移至集群内其它节点,降低业务中断时间;
3、机架感知:根据机房物理拓扑结构,将副本分配在不同的机架、机箱、主机上,有效减少甚至避免物理硬件(电源、交换机等)故障导致的数据丢失。理论上,3 副本结合机架感知配置,系统可最多容忍 2 个机架上的主机全部失效。
目前分布式存储数据冗余采用的技术包括多副本、EC等,其对最低的节点数有要求,如采用3副本,则最少配置3节点,推荐5节点(可以随机2个节点故障继续提供服务);
采用EC,如N+M(N:数据片,M:校验片),则需要的最少节点数为N+M个,推荐N+M+1,如果是N+M:1,则需要的最小节点数是(N+M)/2(往上取整),推荐(N+M)/2(往上取整)+1。