多副本机制和数据自动恢复是分布式存储的基本特性之一,优秀的分布式存储基本都提供无需人工干预的数据恢复功能。对于一款冷热数据自动分层的分布式存储来说,其数据恢复可能使用如下两种策略:
首先分布式存储本身是副本机制,是保障数据强一致性,两份完全相同的数据甚至多份完全相同的数据,如果出现单份数据损坏,立刻或者定时策略触发做数据恢复,这种情况下本地数据肯定是安全的。
如果到容灾级别,双活分数据层双活和应用层双活,存储端只能解决存储层的双活,真正应用级的双活还需要网络层双活,特别是应用软件也要支持双活才行。
业内分布式存储的双活一般是通过延展集群实现,同一个集群,将不同的数据副本防到不同的数据中心,第三方仲裁,在这种情况下单个数据中心故障,仲裁和另一个站点可以将故障站点的数据恢复回来,保障RPO=0,RTO会和业务有很大关系,涉及到应用的切换时间等。如果上层的应用不支持双活,但分布式存储端有延展集群的话,当数据中心故障后,另外一个数据中心拥有完整可用的数据,因此,用户可以手工启动应用,恢复业务的时间大大缩短,RTO也会大幅度降低。
需注意延展集群不能防止逻辑错误,需要配合卷定时快照防止勒索病毒的危害。
XSKY现阶段的延展集群(双活)可以不只是支持块存储,可实现块,文件,对象全面支持,
收起