随着X86性能的提升和万兆 10万兆网络的发展,分布式存储的瓶颈似乎也越来越少,除了特殊行业如金融等对IO有特殊要求的行业。分布式存储是否适用在大多数行业和应用中呢。
以我目前接触过两个例子来说。一个用的超融合运行大数据分析业务,另一个用的Vsan运行虚拟化,上面分布数据库,中间件等,由于业务没有那么大的压力。所以目前看分布式存储是可以胜任这样的环境的。
在实际更多的行业中,还有那些除了对IO有很高要求的行业以外,不适用分布式存储的应用呢
分布式存储更适合于大量或海量的数据存储,易于扩展和高并发读写。
分布式存储大多为文件存储和对象存储,适合存储非结构化数据,如果满足上述特征的场景,分布式存储更加合适。反之,数据量不大,增速不快,多为结构化数据,例如CRM,ERP系统所产生的数据,则传统存储就可以满足需求了。
依照IDC的中国市场分析,分布式存储在国内占比已经超过40%,可以说是普适了大量的行业和场景;
从场景看:
1、私有云和混合云,本身就是分布式存储的主战场,在各个行业内广泛采用,其中政府、互联网、金融、运营商、教育、医疗等等行业已经稳定运行多年。
2、各种类型影像类统,比如金融的ECM和双录,医疗的PACS和病理分析,高科的基因和电镜及AI,制造业的封测和MES,教育的精品课录播,自动驾驶的大量分析类数据,交通的卡口、ETC信息
3、大规模监控云,如政府和运营商的各类视频收集平台
4、海量的备份归档数据
5、两地三中心容灾
分布式比较难适配的场景, 除了对IO延迟及其敏感的场景,其他场景几乎都涉及了分布式存储,近期很多金融机构已经开始尝试利用国产化硬件配合全闪介质进行跑批测试,简单的说就是客户对于双模架构的理解已经非常深刻,不会盲目的进行站队,而是在充分理解自己应用和IO模型的情况下,选择最适合自己的数据存放方法;
随着SSD和网络技术的继续发展,我们有理由推断,分布式存储在市场中占有的场景和行业会继续增加,慢慢成为主流的数据存放方式,结合数据湖以及数据流动的概念,更快更稳定更长久的保存数据,充分发挥数据本身的价值。
收起