背景:虽然分布式存储引擎一定程度上降低了单点故障所带来的可用性降低,但是,为了确保数据的正确性,尤其是因为逻辑错误导致的问题,也是需要做定时的备份,异地容灾等高标准的高可用性方案。
现状:仅仅HBASE有做hbase replication当作异地机房容灾。Hive有备份的方案(Hdfs snapshot+元数据mysql dump),但无异地机房容灾方案。HDFS无备份、异地容灾方案(HDFS未单独作为存储引擎,都是作为HBASE和HIVE的底层)。
问题:是否有较为成熟的针对整个hadoop集群来做备份、异地容灾的方案?如何实现?