如题,现在很多银行影像类文件开始使用对象存储进行保存,针对此类文件已经有三副本的情况下,是否还会做离线备份,针对分布式对象存储的备份应该注意哪些要点?
一般分布式对象存储通过多副本或纠删码等存储策略确保数据的高可用性,如对于重要系统的数据而言,可通过多数据中心多DC的方式以多中心数据同步的形式进行数据同步,实现数据的灾备能力。
收起影像类的文件保存不管是三副本还是EC校验,实现的都是集群内部的节点级别的故障域,此类业务在金融行业内属于重要生产类数据,落地同步需要实现容灾,目前最为常见的采用对象多站点的方式实现异步双活,业务同时在两个数据中心写入,就近读出,元数据强一致性保障数据不会被写花。
单个数据中心宕机最多有分钟级别的数据丢失,备份在这个基础上解决的是逻辑错误的问题,也具有生产意义,但同步要考虑经济投入。
影像数据目前历史数据量大,早期数据量访问热度低,目前可以考虑分层的方式存储,很多金融客户针对这类数据是做冷、温、热分层,对1~3个月以内的数据放在性能最好的对象存储上,3~6个月(或者1年)数据放到温层,6个月(或者1年)以上的数据归档到对象存储或者物理带库等做长期的保存。
收起一般情况下,对于银行数据的重要性而言,是需要做额外的备份,尽管分布式存储对于数据的容错能力已经具备很高的水准。
如果采取分布式存储的原生备份能力,通过存储多个副本来实现。当某个存储节点出故障时,系统能够自动将服务切换到其他的副本,从而实现自动容错。有两种协议方式, 强同步复制及异步复制,两者区别如字面意思,即用户的写请求是否需要同步到备份副本才算成功。假如备份副本不止一个,复制协议还会要求写请求至少需要同步到几个备份副本。
额外的备份,其实很简单,通过物理大盘存储的方式进行,通过时间窗口的方式进行备份,比如按年月日,或者按照系统切分的方式进行。
需要注意几点,1、备份的监控要覆盖。2、数据的一致性要满足。3、要定期进行恢复性测试。