如何处理数据的存储问题,尤其是影像数据?

建设科研大数据平台,一般都是将各个业务系统的数据重新收集整理,结构化的数据也还好,并不占用空间,而非结构化的数据例如影像数据,一个大型三甲医院的增量是非常大的,如果这些数据都抽取到科研大数据平台医院相当于又要重新建设存储,如何平衡这些非结构化的数据的存储

参与8

2同行回答

zyp8365zyp8365高级工程师广东省中医院
对于这类数据,应该要做好统筹规划,医院的数据都是会做容灾备份的,所以一般医院存放同类数据基本都是2份或2份以上,在业务系统、科研大数据平台或者别的其他应用系统对某个非结构化数据有读取或使用需求的时候,应该充分利用容灾备份环境中的同类数据。另外,在软件设计和数据库存...显示全部

对于这类数据,应该要做好统筹规划,医院的数据都是会做容灾备份的,所以一般医院存放同类数据基本都是2份或2份以上,在业务系统、科研大数据平台或者别的其他应用系统对某个非结构化数据有读取或使用需求的时候,应该充分利用容灾备份环境中的同类数据。另外,在软件设计和数据库存放是,该类增量较大的非结构化数据以地址指针的方式存放,如需要调用时再通过地址调转到实际的数据存放路径。这样将极大的缓解该部分数据的读写压力。

收起
医院 · 2022-03-09
浏览864
Dell_zhangcanDell_zhangcan架构师戴尔科技
建议前期可以将医院的 PACS 类非结构化数据都直接放入数据湖中,后期基于数据湖建设影像大数据平台,这样能实现数据的就地存储和就地分析,避免了海量数据在多个平台间迁来迁去。戴尔科技的数据湖还支持重复数据消除功能,这样即使在数据湖中复制几百 TB 的影像数据用于科研,也不...显示全部

建议前期可以将医院的 PACS 类非结构化数据都直接放入数据湖中,后期基于数据湖建设影像大数据平台,这样能实现数据的就地存储和就地分析,避免了海量数据在多个平台间迁来迁去。戴尔科技的数据湖还支持重复数据消除功能,这样即使在数据湖中复制几百 TB 的影像数据用于科研,也不增加过多的存储容量,而且数据复制的速度极快。

收起
硬件生产 · 2022-03-10
浏览838

提问者

diliangyu520
系统分析师内蒙古医科大学附属医院
擅长领域: 云计算存储灾备

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2022-03-08
  • 关注会员:3 人
  • 问题浏览:1534
  • 最近回答:2022-03-10
  • X社区推广