集群中单台TiKV出现故障,如tikv进程终止、TiKV 主机万兆网卡断开、TiKV 主机服务器宕机,集群是否仍然可以对外服务?
收起在部署集群的时候可以为集群中的 tikv 添加 label 信息,PD 会根据 label 信息进行副本调度,根据所配置的 label 级别的不同,可以避免将同一个 region 的两个 replica 调度到:
同一台服务器的两个 tikv 实例上
同一个机架的几个 tikv 实例上
同一个机房的几个 tikv 实例上
据此可以实现服务器级/机架级/机房级的容灾,因为集群中还存活大多数的副本就有能力对外提供服务。
详情参考官方手册:https://www.pingcap.com/docs/op-guide/location-awareness/