容器云平台的存储主要有以下部分:容器云平台自身需要的存储、应用数据持久化存储、镜像存储、中间件存储等,这些存储的选择上是否有区别,在规划上需要如何考虑?
首先,我们要了解集中式存储和分布式存储有哪些优点,相关的资料在网络上非常多,在此不再多赘述,总体而言,二者核心的选型关键在于几点。
1、硬件标准化,或者说硬件非标的比率方面,如果硬件标准化完成,建议选择分布式存储。
2、容量和性能可以水平扩展的需求,对于数据增长不规律或者突增的情况下,建议选择分布式存储,只有分布式存储才能更好的适配数据快速增长的要求。
3、 存储生命周期,一般而言,集中式存储的生命周期大概在8-10年左右,超过10年的风险就较大,而分布式存储可以通过批量的硬件迭代完成存储生命周期的重构。
4、 业务友好,两者对业务都非常友好,如果有一些海量数据归档、 底层操作、数据隔离的需求,分布式存储更好一些。
以上是二者在选择性方面的考虑。
集中式存储适合场景:
集中式的存储依然是目前不可替代的,一般用于企业的生产、办公等交互频繁的关键业务。因为集中存储效率高,速度快,这是分布式存储不具备的优势,分布式由于数据分布在不同的区域保存,应用存取自然会损耗一定的存取时延。
集中式存储的物理介质集中布放;数据要上传到中心对机房环境要求高,要求机房空间大,承重、空调等都是需要考虑的问题。
传统的SAN存储,面对PB级规模存储时,成本非常高,数据共享差,难以支撑多用户文件共享。
常见的NAS存储,由于共享网络带宽,并发性能差。
分布式存储适合场景:
大数据、时序数据库,列式数据库,非结构化数据,搜索引擎索引等
海量数据的非结构化数据最适合分布式存储,加快系统的读写速度,提高系统的容错性和可用性。
分布式存储的物理介质可以分布到不同的地理位置,数据就近上传,对骨干网带宽要求低;可采用多套低端的小容量的存储设备分布部署,设备价格和维护成本较低;小容量设备分布部署,对机房环境要求低。