建设科研大数据平台,一般都是将各个业务系统的数据重新收集整理,结构化的数据也还好,并不占用空间,而非结构化的数据例如影像数据,一个大型三甲医院的增量是非常大的,如果这些数据都抽取到科研大数据平台医院相当于又要重新建设存储,如何平衡这些非结构化的数据的存储
建议前期可以将医院的 PACS 类非结构化数据都直接放入数据湖中,后期基于数据湖建设影像大数据平台,这样能实现数据的就地存储和就地分析,避免了海量数据在多个平台间迁来迁去。戴尔科技的数据湖还支持重复数据消除功能,这样即使在数据湖中复制几百 TB 的影像数据用于科研,也不增加过多的存储容量,而且数据复制的速度极快。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30