非结构化数据同结构化数据一样,可按照不同的需求,实现多种方式的备份。而唯一不一样的,对于大数据,或者说海量的非结构化数据,由于数据量的巨大,不能用传统的备份方式来处理,这时候我们会建议采用历史数据归档替代传统的备份,一方面保证数据保护的时间窗,同时确保数据的回溯访问时间。
至于是采用对象还是文件还是专用的备份装置,需要考虑的核心仍然是应用需求!如果应用需要立即访问,归档一定比备份好,如果考虑得更多的成本,对RTO不是很敏感的话,采用专用备份装置,连接低成本的对象存储也会是一个不错的选择。
而对于容灾,基于文件的同步复制、基于对象的多站点分布都是有大量成功案例的方案,具体采用什么样的方案,需要根据具体的环境做相应的分析的选择。
收起这个问题楼上回答的已经很全面了,我想补充一下关于容灾方面的一些看法。
因为工作需要,前段时间深入了解了一些对象存储的容灾解决方案。从现阶段看,非结构化数据的容灾解决方案,对象存储的解决方式是最完整可行的。(暂不考虑价格成本)
关键问题是要解决数据在两个中心存储并如何分配的,在容灾情况下数据如何同步,保障一致性。
其实我的理解,对象存储提供了从应用接口层到存储层的整体解决方案,这要比NAS存储在解决问题的层次要高一些,因此,在不考虑成本的前提下,对容灾有需求的,肯定是有限考虑对象存储的。
对象存储支持文件多版本特性,该特性能够有效地保护用户的重要数据,在误删、误覆盖、被篡改的场景下,提供完备的数据恢复机制,大大提高了重要数据的安全性。
除此之外,在多版本技术的基础上进行了增强,实现了持续数据保护功能,能够在业务出现逻辑错误,从而导致大量数据错误的场景下,快速、自动地对数据进行回滚恢复,极大的降低了逻辑错误场景下的数据恢复成本。
SDS 本身非常适合用作数据备份:
l 硬件成本低:用户的选择面很大,可以使用高性价比通用服务器 + 纠删 / 多副本策略实现海量数据的低成本备份
l 多种备份方式: x86 硬件本地存储、公有云在线存储、蓝光存储
l 备份数据也可以在线访问:统一的命名空间简化数据访问,数据可以长期在线访问以实现深化利用
杉岩是国内首家完成 Veritas NetBackup 兼容认证的企业对象存储厂商,备份方案已经在中移物联网中得到应用,支撑 PB 级、跨省域的数据灾备需求。
对象存储的容灾功能支持数据多个站点之间的数据自动同步,实现数据的异地容灾,并且多个站点保持多活,在某个数据中心故障时,能够快速切换到另一个数据中心。
收起先明确几个概念的定义,然后再做讨论。
数据备份:
数据容灾
备份窗口时间
灾备演练
非结构化数据一般来说有NAS和对象两种存储方式,存储方式不同,数据量、小文件数量、日数据变化量的不同,都会影响到数据备份和数据容灾的技术方案。
对象存储的数据备份和数据容灾
由于对象数据不可修改的特性——只能被删除或覆盖,不适合频繁修改的数据——因此对象存储数据备份技术相对简单,而且无需考虑备份数据量和小文件数量的影响。
数据备份。
数据容灾
备份窗口时间。
总结一下:非结构化数据在对象系统上的备份和容灾,更多是依赖对象存储自身的技术特性,在某种程度上近似模拟出来的。
NAS存储的数据备份和数据容灾
数据量不大,小文件数量有限,日数据变化量不多,传统企业级备份软件,能够在可接受的备份窗口时间内,完成数据备份和数据容灾。
但是量变产生质变。
在海量数据、海量小文件的前提下,哪怕日数据变化量有限,传统企业级备份软件,大多数时候都无法在可接受的备份窗口时间内,完成数据备份。
这时候,最好的办法,就是使用NAS存储底层数据复制技术,来实现NAS存储海量非结构化数据的备份和容灾。