医疗行业非结构化大数据存储策略的选择?

医疗行业非结构化数据,数据量大而且增速大,但随着时间的推移,并发访频率逐渐降低,因此一般采用分级存储技术,目前分级存储设计发展为在线存储、近线存储、离线存储,那么我的问题是,有没有一种算法,确定多久的数据适合在线存储,多久的数据适合近线存储,多久的数据适合离线存储才比...显示全部

医疗行业非结构化数据,数据量大而且增速大,但随着时间的推移,并发访频率逐渐降低,因此一般采用分级存储技术,目前分级存储设计发展为在线存储、近线存储、离线存储,那么我的问题是,有没有一种算法,确定多久的数据适合在线存储,多久的数据适合近线存储,多久的数据适合离线存储才比较科学?

收起
参与41

查看其它 2 个回答叶均亮的回答

叶均亮叶均亮技术总监深圳锐取信息技术股份有限公司

在线、近线、离线,传统意义上标准的三级存储,鉴于存储介质本身的价格走低,医院网络环境的快速发展,随着磁带存储模式的逐渐淘汰,云存储的摸索应用。从我的了解与观察来看:三级存储的架构,正向着二级存储发展,即在线存储、近线存储,原本的离线存储数据被囊括在近线存储中。但您针对三级存储架构,所提出的问题依然有价值,我的一些观点表达如下:

在线存储使用SSD硬盘,成本相对高,所以往往容量有限,以二甲级别医院的全院PACS产品应用举例,通常会设定3个月的数据作为在线生产数据。1—2年的数据,通常作为近线存储,超过2年的数据作为离线数据存储。

被作为近线或离线存储的数据,当被再次调阅访问时,数据将被提取作为缓存数据保存,并不改变数据本身的磁盘存储位置,这些缓存数据可定期由用户清理。

综上,在进行产品选型时,特别是涉及到数据归档存储服务方面,可以要求供应商展示这几点,来方便不同医院自行设定:

1、应当可设定数据归档的规则,可以是根据时间期限的设定,也可以根据存储设备空间使用率来设定,二者只是变现形式不同,在本质上是一样的。

2、数据被重新调阅访问时,系统应有缓存空间予以处理,缓存空间的大小也是可设定,并可定期自行清理或人为清理。

至于还有采取二级存储的架构,以及某些厂商的归档存储服务特点,仁者见仁,此处不赘述。

系统集成 · 2016-05-05
浏览2795

回答者

叶均亮
技术总监深圳锐取信息技术股份有限公司
擅长领域: 大数据存储大数据云计算

叶均亮 最近回答过的问题

回答状态

  • 发布时间:2016-05-05
  • 关注会员:8 人
  • 回答浏览:2795
  • X社区推广