针对分布式块存储,如何选择合适的厂家?

目前市场上各类厂家开源、非开源分布式存储杂七杂八,市场很混乱。基于虚拟化或者私有云环境,怎么在混乱的各类分布式存储里选择性价比高的、适合自己块存储?是选择什么架构的好,选择什么样的固态与机械盘比例(数量比or容量比?)的适合这类场景呢谢谢...显示全部

目前市场上各类厂家开源、非开源分布式存储杂七杂八,市场很混乱。基于虚拟化或者私有云环境,怎么在混乱的各类分布式存储里选择性价比高的、适合自己块存储?是选择什么架构的好,选择什么样的固态与机械盘比例(数量比or容量比?)的适合这类场景呢
谢谢

收起
参与32

查看其它 13 个回答Jerry Miku的回答

Jerry MikuJerry Miku  其它 , The Global 500

明确产品采购需求:
业务驱动信息,选型的基础是明晰分布式存储的业务场景需求,结构化和非结构场景对产品要求存在显著差异,业务场景需求关系到数据量级、数据结构、IO模型特征、峰值访问等等因素,这些都是直接影响分布式存储性能的重要因子,只有这些都想清楚了,采购的需求才会明确、采购方向才会匹配。

了解分布式架构:
除了上边专家提到的分布式存储性能指标(POC基本可测出来),考虑到现阶段存储的综合性能基本过剩,个人建议更要去关注存储的使用成本,尤其是分布式存储的几大核心模块:首先最重要的是元数据管理技术,分布式互联的核心就是metadata,元数据管理设计直接决定了这款存储性能的表现及维护的成本。市面上的分布式存储大致基于Ceph、Gluster以及其他架构,各架构有什么优势及缺点,厂家基于这些架构自研优化了哪些方面。产品靠不靠谱、好不好用,元数据管理设计占了很大比重。其次就是动态扩容,分布式存储宣传的动态扩容是容量与性能的线性扩容,扩容节点后测试性能,看看是否能达到线性。最后就是故障容忍,简单粗暴,直接拔盘关节点,SSD、HDD、节点断电,观察集群稳定性与自愈。

关注业务测试POC:
POC不要局限于常规的4K/8K/256K Fio测试,这些测试数据只是反映存储实际性能的一个表征。这些数据好看与否,和客户业务场景下实际表现没有决定性的强关联。 Fio测试 非常完美,采购后实际使用效果就好,NO,不一定。所以,POC一定要带有业务测试数据的测试,业务数据往往呈现一定的数据特征和IO特征,模拟真实业务场景看看存储在这些特征下的综合表现。另外由于分布式元数据的特性,务必要关注高存储使用率下存储的IO性能,比如存储使用达到75%--85%,测试存储IO性能的衰减。

其他客制化需求:
a,SSD与HDD的比例,一般在15%--30%容量比之间(个人经验至少15%),各家产品不一样,对于SATA SSD、NVME SSD各家产品支持力度不一样,与厂家多交流沟通。
b,对接云或者容器,属于一个增值功能,以实际测试的结果为准,厂家宣传和实际使用效果差距有些大。

IT其它 · 2021-12-29
浏览1986

回答者

Jerry Miku
其它The Global 500
擅长领域: 存储备份灾备

Jerry Miku 最近回答过的问题

回答状态

  • 发布时间:2021-12-29
  • 关注会员:15 人
  • 回答浏览:1986
  • X社区推广