目前市场上各类厂家开源、非开源分布式存储杂七杂八,市场很混乱。基于虚拟化或者私有云环境,怎么在混乱的各类分布式存储里选择性价比高的、适合自己块存储?是选择什么架构的好,选择什么样的固态与机械盘比例(数量比or容量比?)的适合这类场景呢
谢谢
医院对分布式的块存储,选择厂家的时候往往关注以下要点:
SmartX的解决方案受到各类医院(综合,专科,大型三甲,三甲,三级,二级)的青睐,也是因为SmartX同时满足了以上5点,其分布式块存储ZBS和基于该分布式块存储的超融合方案既有大量的医院的实际应用案例,核心系统,核心数据库,集成平台,综合业务系统,内网,DMZ外网等均有使用,易用性,性能,功能,可用性,可靠性,灾备,双活,服务能力得到了充分的医院用户的长时间验证,具备良好的口碑,同时其基于ZBS的超融合软件也是中国区金融领域时占有率第一名的厂商,在对性能,稳定性,可靠性以及服务能力要求极高的核心金融业务领域也得到广泛的验证,口碑良好;同时,ZBS分布式块存储方案很好的与超融合结合,同时支持SmartX完全自主研发的,的企业级的原生ELF虚拟化和VMware虚拟化,同时满足医院对于虚拟化的不同需求,此外,Gartner也将SmartX评为亚太地区客户之选第一名,这也是SmartX专业及时的服务能力的证明,SmartX也是国内最早专注于分布式块存储与超融合方案的,自主研发的厂商,分布式块存储方案不是基于开源的魔改或者收购,而是具备真正的企业级支撑能力的自主研发的产品,因此这个领域的专业能力也能得到保障。
收起分布式块存储应该关注以下几点:
一、适用场景
分布式块存储相对于存储阵列的优势在于扩展性,所以适用于大规模的虚拟机、容器场景。如果是小规模,其可靠性、成本、性能相对于存储阵列都有劣势。一般来讲,大概10PB为界。有人说存储阵列贵,但从Gartner等分析师的洞察来看,双方的价格比较还真不好说。
二、关键指标
社区开源式的分布式存储需要您公司自己有相当的研发和运维能力,所以人力资源成本也要考虑进去。厂商的分布式存储可靠性会高一些,而且有厂商做背书,虽然采购成本会高一些,但是人力成本相对低一些。
固态盘和机械盘的比例,需要结合应用类型和POC情况来看。
的确现在分布式存储的厂家技术杂七杂八。有些混乱。不过基本上还是可以划分为开源的和商用的两种基础。商用的自然以VMWARE的最优,价格偏贵,
而开源的则属于百花齐放的状态。选择上我个人是倾向于,技术成熟度,可靠性,性能,价格的级别往下优选。毕竟存储是整个业务的核心。一旦数据丢失可不是闹着玩的。所以一定选择大厂产品,产品成熟,研发技术实力雄厚,实际运行中有较多的成功案例,其次在考虑价格,
而固态和机械一般都是用少量固态作为系统,缓存,运算盘,海量的机械盘用作存储。比例要看实际应用,不同的场景需求也不同。一般厂家的售前会给出一个推荐的配置。如果资金充足。业务重要。也不排除考虑全闪存。
明确产品采购需求:
业务驱动信息,选型的基础是明晰分布式存储的业务场景需求,结构化和非结构场景对产品要求存在显著差异,业务场景需求关系到数据量级、数据结构、IO模型特征、峰值访问等等因素,这些都是直接影响分布式存储性能的重要因子,只有这些都想清楚了,采购的需求才会明确、采购方向才会匹配。
了解分布式架构:
除了上边专家提到的分布式存储性能指标(POC基本可测出来),考虑到现阶段存储的综合性能基本过剩,个人建议更要去关注存储的使用成本,尤其是分布式存储的几大核心模块:首先最重要的是元数据管理技术,分布式互联的核心就是metadata,元数据管理设计直接决定了这款存储性能的表现及维护的成本。市面上的分布式存储大致基于Ceph、Gluster以及其他架构,各架构有什么优势及缺点,厂家基于这些架构自研优化了哪些方面。产品靠不靠谱、好不好用,元数据管理设计占了很大比重。其次就是动态扩容,分布式存储宣传的动态扩容是容量与性能的线性扩容,扩容节点后测试性能,看看是否能达到线性。最后就是故障容忍,简单粗暴,直接拔盘关节点,SSD、HDD、节点断电,观察集群稳定性与自愈。
关注业务测试POC:
POC不要局限于常规的4K/8K/256K Fio测试,这些测试数据只是反映存储实际性能的一个表征。这些数据好看与否,和客户业务场景下实际表现没有决定性的强关联。 Fio测试 非常完美,采购后实际使用效果就好,NO,不一定。所以,POC一定要带有业务测试数据的测试,业务数据往往呈现一定的数据特征和IO特征,模拟真实业务场景看看存储在这些特征下的综合表现。另外由于分布式元数据的特性,务必要关注高存储使用率下存储的IO性能,比如存储使用达到75%--85%,测试存储IO性能的衰减。
其他客制化需求:
a,SSD与HDD的比例,一般在15%--30%容量比之间(个人经验至少15%),各家产品不一样,对于SATA SSD、NVME SSD各家产品支持力度不一样,与厂家多交流沟通。
b,对接云或者容器,属于一个增值功能,以实际测试的结果为准,厂家宣传和实际使用效果差距有些大。
固态和机械盘的比例,主要看技术原理,分布式块存储中固态通常做缓存。
传统存储中混合磁盘的分级存储技术,在分布式块存储中大家关注度小。
建议如果技术原理允许的情况下,能都配固态,就都用固态。毕竟现在价格也能接受了
大概选型思路,我觉得可参考如下:
首先应该明确选型目标,是为了某些特定的业务应用场景,还是新技术探索,革新技术架构,当然如果是技术探索,那么一般是先从测试环境开始,目的就是为了研究分布式块存储的适用场景;
然后是架构选择,目前分布式块存储主要是融合架构和分离架构两种,各有利弊,应结合自身实际情况选择切入点;
再者是存储厂家的选择,主要看是否有行业内案例可借鉴或有较好合作基础的厂商或公认的技术领导者地位的,尽可能的多交流,关键是也要摸清楚自身的需求,并剔除并不适配的厂家产品;
最后是将自身的需求转化为重点选型指标,再圈定几家产品以同样的标准做POC测试,最终敲定产品选型。
首先和行业有关系,优选同行业有案例有类似场景的厂商,其次有几个考量评估点
1、最重要的是安全性,各种故障情况下的业务安全性是否保障(硬盘,节点,机柜,数据中心RTO,RPO的考虑);
2、性能是否满足业务需求以及未来增量;接入业务测试或者模拟业务的压力机长时间的测试,模拟cache被打爆的情况,短时间的性能测试都在缓存中,无法评估正式性能;
3、全协议支持,考虑新业务的迭代增长,产品的开发周期
4、横向扩展能力,业务无感知的情况下增加节点
5、数据流动:跨数据中心,跨平台的数据流动
6、数据生命周期
7、硬件迭代对业务的影像,是否涉及迁移数据
8、API完善透明开放
9、运维便捷性:自动化运维等等
收起