查看其它 8 个回答一只红松鼠的回答

一只红松鼠一只红松鼠其它其它

先说第二个问题。这个问题的复杂之处在于分布式和集中式不是替代关系。从总的趋势看,分布式架构成为存储架构趋势是对的,但集中式架构却融入了分布式中,并没有完全消失。毕竟分布式存储和集中式存储是同父异母的亲兄弟。另一个复杂的问题是:分布式存储是什么,很多IT概念有交集导致大家在说同一个词时,并不是说的一个事情,最后我会做下分析,这里再明确一下,我认为的趋势是分布式架构是存储架构的趋势,同时伴随着分布式和传统意义上集中式架构的融合。

现在市面上大部分存储都采用了分布式架构了,包括被称为集中式存储的EMC,华为的企业存储,其实打开来看,也是分布式架构的。如果对比一下华为OceanStor和Ceph的架构,是不是非常像?

华为企业存储架构,传统上认为是集中式,实际上已经是分布式

华为企业存储架构,传统上认为是集中式,实际上已经是分布式

Ceph架构

Ceph架构

其实这也很正常。最早的分布式存储是XIV(后来被IBM收购)。而它的创始人同时是 EMC Symmetrix之父摩西·亚奈。货真价实的同父异母的亲兄妹了属于。

既然“集中式”存储都用了分布式架构了,那当然分布式架构就成为趋势了。但同时很多分布式存储也使用的集中式存储的架构,来构成分布式存储的基本单元。我们看两个例子:

第一个是FACEBOOK,它用于分布式存储的72盘位开源服务器既可以只有一个计算节点,也可以装两个计算节点,也就是可以拆成两个服务器,还可以不装计算节点,变得和磁盘阵型中的硬盘框一样。

如果第一个还不是很明显,再看一下AWS收购的E8 Storage的架构,典型的双控架构:

这个双控节点是组成分布式存储的一个节点,AWS块存储最近新产品升级很快,与收购E8关系很大。

为什么会有这种你中有我的情况?其实还是需求决定的。分布式的优势一个是扩展性好,另一个是故障时任意部件都可被接管。作为“集中式存储”的主要应用场景,可靠性是非常重要的,扩展性要求也是越来越高,因此融入(或者说本来就有,毕竟一个爹)分布式架构就很容易理解。而“集中式”双控架构一方面IO性能上有优势,这可能是Aws看重它的原因。另一方面现在分布式存储 的一个服务器硬盘很多,像华为的pacific,一台服务器最多120块盘,如果坏一台,那影响是相当大。所以pacific也用了双控架构,可以互相接管,可以有效降低爆炸半径

可能会有朋友觉得你讲的分布式架构,和我理解的分布式存储不是这样的。我经常碰到的是把SDS和分布式存储划等号,而还有很多时候把SDS和通用PC服务器+存储软件划等号。要看清这个问题只要想想这几个东东的概念。

分布式存储,显然就是采用了分布式架构的存储,至于使用什么硬件,不是决定它是不是分布式存储 的关键。只不过,最早的分布式存储用了通用硬件,而后来开源的分布式存储更是只有软件 而已。

SDS,软件定义存储 。从名称就可以看出,SDS的灵魂是“定义”,否则就变成了“软件存储”。只不过和上面类似的最早的SDS只提供了软件,所以它同时也是软件存储。

可见这几个只是有交集,但定义完全不同的概念。但偏偏交集的“面积”比较大,或者比较受认可,所以经常被互相替换。如果你的问题是分布式存储软件模式是不是趋势,其实从FaceBook和AWS的做法也能看出来。虽然他们没有制造硬件,但使用的都是自己设计,与自己的软件捆绑的硬件,已经不是通用硬件了。他们真的做了软件来“定义”的存储。归根结底,分布式,软硬解耦,专有硬件这些都与需求和自身能力想匹配,没有最好的架构,只有最合适的架构。

再回到第一个问题,可能大部分朋友提到的集中式存储也不是专指集中式存储架构,而是指使用专有硬件、软硬一体化,具备比较高性能的存储系统,代表就是磁盘阵列。从前面的回复可以看到,由于需求仍然存在,这种存储同样会存在,只是架构会有所变化。融合了分布式等架构后,再叫集中式存储已经不太合适,我更愿意称其为企业存储。这个企业不是指企业使用,而是高级专业的意思,类似英语中企业版,企业号航母,企业号宇宙飞船的意思。

IT咨询服务 · 2021-11-09
浏览1563

回答者

一只红松鼠
其它其它
擅长领域: 存储云计算分布式架构

一只红松鼠 最近回答过的问题

回答状态

  • 发布时间:2021-11-09
  • 关注会员:10 人
  • 回答浏览:1563
  • X社区推广