2.科研大数据平台现在发展方向主要有四个方向:影像,大样本分析,多模态,真实世界研究,目前以真实世界研究居多,但是趋势是往多模态方向发展,这就要求传统的文本,结构化数据处理外,还需要结合影像图片,甚至是超声之类的视频,对于这类数据处理,底层基础架构如何支撑?
科研数据类型越来越多样化,应用软件对底层基础架构的接口也越来越多样化,从传统的 NAS (SMB/NFS 等 ) 协议,到对象存储 S3 以及 HDFS(Hadoop 分布式文件系统 ) ;这就需要底层存储架构架构满足丰富的非结构化文件接口要求,同时满足同一份数据被不同方式调用,避免数据重复存储,造成资源浪费;同时科研数据体量大,底层存储要具备高扩展性,只有真正意义上的分布式存储可满足要求;同时科研平台对算力的要求也特别高,需要一套匹配的高性能计算集群( HPC )才能真正发挥数据的价值;计算存储分离的架构,也更方便后续灵活扩展算力或者存储资源,灵活响应科研需求;
收起