大数据平台的存储架构选择与平台的应用特点密切相关。如果是采用传统数据库 +Hadoop 架构,而且运行在虚拟机上的大数据应用,可以采用全闪分布式存储,也可以采用全闪 SAN 存储。如果是要采用 HPC 架构,基于物理服务器做基因测序等生命科学类应用,则需要根据是否运行 Lustre 、 BeeGFS 等并行文件系统选择存储架构。如果不使用并行文件系统,那么分布式存储是很好的选择。就非特大型医院而言,戴尔科技的 PowerScale ( Isilon )是非常适合的大数据存储。在生产实践中,有医院将 PACS 业务和 CDR (基于 Hadoop )放在同一套 Isilon 存储上运行,不仅节省了硬件投资和机房空间,平台的扩展性和数据安全性也得到了大大的提高。
收起