双活数据中心基础软件架构,也就是基于软件的存储架构,在企业并行文件系统这块,我觉得还是首选GPFS。GPFS-FPO、HDFS、Ceph都是分布式文件系统的代表。
HDFS是开源的分布式文件系统,是专门为Hadoop这样的大数据计算而生的。在处理离线批量的大数据上,有着天然的优势。但是HDFS处理小的、海量文件就力不从心。而它的读写方式是一写多读,并行写是不适合的。
Ceph也是开源的,功能上很强大,既可以支持对象存储、又可以支持块存储、还可以支持文件系统,可谓样样都可以拿的出手,但是Ceph在对象存储这一块,又比不过SWIFT,文件系统的可靠性上又比不过GPFS,最适合的领域还是块存储方面,结合OPENSTACK,作为OPENSTACK Cinder的后端存储非常适合。
GPFS是老牌的商用文件系统,自GPFS3.5版本以来,开始推出了GPFS-FPO,这是基于无共享架构的分布式文件系统,在实时并发文件系统存储这块更具优势。
收起这里面只对IBM GPFS有使用经验,GPFS作为软件定义存储概念的先驱,在V3.5版本后,针对大数据,云计算,RELEASE FPO特性。批量的PC SERVER本地盘组成的共享文件系统可用性非常高。