目前越来越多的的行业开始建立自己的大数据。通过分布式的架构解决了对非结构化数据的管理问题。但是数据仓库中的数据量也越来越庞大。对于数据仓库的海量数据。应该采用怎样的备份产品才能既快速又有效呢。传统的磁带库虽然容量大。但是效率很低。采用磁盘存储的方式哟成本有过高。还有其他的解决方案吗
(1)所谓的分布式存储,在本地,是不需要备份的,因为分布式都有多个副本,本身就考虑了故障情况。
(2)灾备还是需要的,但由于海量数据,异地的灾备基本变的不可能,所以,通常做法是将异地机房的节点通过网络变成本地集群的一个节点。然后将副本部署在上面,但这样同步会比较慢。但如果是mds节点,异地灾备,还没有好的办法。