只能说,存算分离是大数据架构演进的重要趋势。
下面采用一些官方的报告。
Hadoop1.0时代,计算和存储是高度融合,仅能处理单一的MapReduce分析业务;Hadoop2.0时代,计算层与数据开始解耦,通过Yarn实现了独立的资源管理,并开始支持Spark等更多的计算引擎;而如今来到Hadoop3.0时代,计算存储已分开演进,通过Hadoop EC来支持冷数据的存储,同时引入外置存储,如S3,增强其存储底座能力,逐步向数据湖架构演进。
Hadoop3.0时代,计算正向轻量化和容器化方向发展,计算存储分离演进已成为事实。计算存储分离后,我们用企业级的存储基座替代原来的原生大数据存储基座,好处是可以把当前企业级存储的先进技术带入到大数据里面来,如高可靠、高利用率、多协议融合等,更好地释放数据的价值。
从性能角度讲,
存储计算分离的架构有利于发挥性能优势,各自发挥自己的优势。从很多技术发展的趋势来看,最终都会走向专业细分化的趋势,毕竟没有任何技术架构或者平台是万能的,都是针对某种场景才能发挥最大的优势,没有万能钥匙,技术发展的最终目标就是把合适的技术应用在合适的场景当中。
从安全角度讲,
存储计算分离的架构有利于企业更有针对性地应用不同的安全策略来进行管控。数据才是企业的资源,计算只不过是对资源进行加工的工具而已,两者在安全上面的要求和管控策略完全不同。
需要区分具体场景,一般来说存储与计算均衡发展的场景,尤其虚拟化场景,超融合已经是确定的趋势,如果是存算发展不均衡的情况下,比如计算密集型的高性能计算或者存储密集型的视频监控,肯定还是存算分离的。
分离式部署的优点:计算资源利用率低,存储资源利用率高
超融合部署的优点:计算资源利用率高,存储资源利用率高
根据两者优缺点,结合实际场景有针对性看待。