若将非结构化数据由传统存储迁移至对象存储或MPP系统,数据的层次结构、目录层级以及数据访问方式均可能发生变化,业务系统对迁移后数据的访问存在巨大隐患。在规划时如何针对性解决此类问题?
收起对象存储抛弃了传统的基于树状文件系统的管理方式,通过Key-Value的扁平式架构来管理海量文件,保障了海量文件下文件读写的性能。为了保证在分布式系统架构下的数据安全性,对象存储通常采用纠删码或者多份副本的方式预防磁盘、节点级的硬件故障,同时通过多站点复制,保证站点级故障下数据的可用性。
对象存储通过 API接口进行数据访问,应用或者客户端可以直接调用访问数据,更加便捷,支持S3、HDFS、Swift等多种协议。
对象存储经常被比作在一家高级餐厅代客停车。当一个顾客需要代客停车时,他就把钥匙交给别人,换来一张收据。这个顾客不用知道他的车被停在哪,也不用知道在他用餐时服务员会把他的车移动多少次。在这个比喻中,一个存储对象的唯一标识符就代表顾客的收据。当需要获取数据时,只需要告诉对象存储这个唯一标识符,剩下的检索工作均由对象存储本身完成。
由于访问方式上不同,涉及存储变更后应用系统也需要进行访问方式上的改造,需要有一定的过渡期,同时也要考虑老数据的迁移问题。