分布式存储相对应集中式存储,有哪些数据数据保护机制,除了多分布和纠删码,另外还有哪些智能技术?
收起分布式存储的数据保护机制还是很全面的,可以分几个维度来看:
基础数据保护:数据多副本和EC纠删码技术,EC纠删码还有特殊的支持缩列等方案;基于基础的数据保护,引入故障域的概念,可以从硬盘到节点到机柜到数据中心设定故障域,域间数据相互没有影响;
被动数据保护:主要是指周期性的物理磁盘和逻辑块单位的扫描,及时发现坏块或坏单位,进行自动修复,避免静默错误导致数据丢失;比较好的做法是在写入和存放时都加入校验技术,保障应用、缓存和落盘数据一致;
主动数据保护:基于块和文件的快照,基于对象的快照和多版本,这里ROW快照和压缩去重技术已经广泛应用,与传统存储无二;各种异步复制技术,不管是针对块、文件还是对象,异步复制技术也已经非常成熟;分布式存储的数据分层技术相比传统存储起步更早,可以根据数据生命周期在各层级存储之间自动流动,事实上也可作为一种多副本的数据保护方式;还有基于快照的克隆,多卷统一快照,归档等等,保证数据一致性的同时搞定本地和异地备份;
高级数据保护:分布式存储同样可以做到数据双活,一搬块和文件存储是在池级别实现,通过延展集群的方式进行同城部署;对象存储可以配置多站点模式,直接实现元数据多活,如果配合底层的延展集群,可以做到RPO和RTO均等于0;