目前市场上各类厂家开源、非开源分布式存储杂七杂八,市场很混乱。基于虚拟化或者私有云环境,怎么在混乱的各类分布式存储里选择性价比高的、适合自己块存储?是选择什么架构的好,选择什么样的固态与机械盘比例(数量比or容量比?)的适合这类场景呢
谢谢
明确产品采购需求:
业务驱动信息,选型的基础是明晰分布式存储的业务场景需求,结构化和非结构场景对产品要求存在显著差异,业务场景需求关系到数据量级、数据结构、IO模型特征、峰值访问等等因素,这些都是直接影响分布式存储性能的重要因子,只有这些都想清楚了,采购的需求才会明确、采购方向才会匹配。
了解分布式架构:
除了上边专家提到的分布式存储性能指标(POC基本可测出来),考虑到现阶段存储的综合性能基本过剩,个人建议更要去关注存储的使用成本,尤其是分布式存储的几大核心模块:首先最重要的是元数据管理技术,分布式互联的核心就是metadata,元数据管理设计直接决定了这款存储性能的表现及维护的成本。市面上的分布式存储大致基于Ceph、Gluster以及其他架构,各架构有什么优势及缺点,厂家基于这些架构自研优化了哪些方面。产品靠不靠谱、好不好用,元数据管理设计占了很大比重。其次就是动态扩容,分布式存储宣传的动态扩容是容量与性能的线性扩容,扩容节点后测试性能,看看是否能达到线性。最后就是故障容忍,简单粗暴,直接拔盘关节点,SSD、HDD、节点断电,观察集群稳定性与自愈。
关注业务测试POC:
POC不要局限于常规的4K/8K/256K Fio测试,这些测试数据只是反映存储实际性能的一个表征。这些数据好看与否,和客户业务场景下实际表现没有决定性的强关联。 Fio测试 非常完美,采购后实际使用效果就好,NO,不一定。所以,POC一定要带有业务测试数据的测试,业务数据往往呈现一定的数据特征和IO特征,模拟真实业务场景看看存储在这些特征下的综合表现。另外由于分布式元数据的特性,务必要关注高存储使用率下存储的IO性能,比如存储使用达到75%--85%,测试存储IO性能的衰减。
其他客制化需求:
a,SSD与HDD的比例,一般在15%--30%容量比之间(个人经验至少15%),各家产品不一样,对于SATA SSD、NVME SSD各家产品支持力度不一样,与厂家多交流沟通。
b,对接云或者容器,属于一个增值功能,以实际测试的结果为准,厂家宣传和实际使用效果差距有些大。