医疗行业非结构化大数据存储策略的选择?

医疗行业非结构化数据,数据量大而且增速大,但随着时间的推移,并发访频率逐渐降低,因此一般采用分级存储技术,目前分级存储设计发展为在线存储、近线存储、离线存储,那么我的问题是,有没有一种算法,确定多久的数据适合在线存储,多久的数据适合近线存储,多久的数据适合离线存储才比较科学?

参与41

3同行回答

叶均亮叶均亮技术总监深圳锐取信息技术股份有限公司
在线、近线、离线,传统意义上标准的三级存储,鉴于存储介质本身的价格走低,医院网络环境的快速发展,随着磁带存储模式的逐渐淘汰,云存储的摸索应用。从我的了解与观察来看:三级存储的架构,正向着二级存储发展,即在线存储、近线存储,原本的离线存储数据被囊括在近线存储中。但您针对...显示全部

在线、近线、离线,传统意义上标准的三级存储,鉴于存储介质本身的价格走低,医院网络环境的快速发展,随着磁带存储模式的逐渐淘汰,云存储的摸索应用。从我的了解与观察来看:三级存储的架构,正向着二级存储发展,即在线存储、近线存储,原本的离线存储数据被囊括在近线存储中。但您针对三级存储架构,所提出的问题依然有价值,我的一些观点表达如下:

在线存储使用SSD硬盘,成本相对高,所以往往容量有限,以二甲级别医院的全院PACS产品应用举例,通常会设定3个月的数据作为在线生产数据。1—2年的数据,通常作为近线存储,超过2年的数据作为离线数据存储。

被作为近线或离线存储的数据,当被再次调阅访问时,数据将被提取作为缓存数据保存,并不改变数据本身的磁盘存储位置,这些缓存数据可定期由用户清理。

综上,在进行产品选型时,特别是涉及到数据归档存储服务方面,可以要求供应商展示这几点,来方便不同医院自行设定:

1、应当可设定数据归档的规则,可以是根据时间期限的设定,也可以根据存储设备空间使用率来设定,二者只是变现形式不同,在本质上是一样的。

2、数据被重新调阅访问时,系统应有缓存空间予以处理,缓存空间的大小也是可设定,并可定期自行清理或人为清理。

至于还有采取二级存储的架构,以及某些厂商的归档存储服务特点,仁者见仁,此处不赘述。

收起
系统集成 · 2016-05-05
浏览2783
s6dongs6dongit技术咨询顾问东软集团
目前的中高端存储大多支持自动分层技术,即自动判断访问频率的高低,然后将经常访问的“热点”数据自动存放在高速磁盘上,将不经常访问的“非热点”数据自动存放在低成本低速的磁盘上。要实现自动分级存储需要在存储产品购买和配置选型时做好规划,例如购买一部分SSD高速磁盘,再...显示全部

目前的中高端存储大多支持自动分层技术,即自动判断访问频率的高低,然后将经常访问的“热点”数据自动存放在高速磁盘上,将不经常访问的“非热点”数据自动存放在低成本低速的磁盘上。

要实现自动分级存储需要在存储产品购买和配置选型时做好规划,例如购买一部分SSD高速磁盘,再购买一些SATA或SAS磁盘作为低端存储介质。一般高速磁盘的占比为5%-15%比较合适,可以提供比较好的性价比。

关于多久的数据适合做离线存储,这个要根据医疗行业单位自身的情况和规定进行确定,例如HIS数据需要长期保持在线,一般医院要求临床数据至少要保留三年等,要看具体情况具体分析。建议在数据中心配置一个虚拟磁带库,用于近线数据保留和规定,然后再配置一个物理磁带库,对于超过保存期限的,需要离线保留的数据进行归档保存。

收起
互联网服务 · 2016-05-05
浏览2761
  • 我认为自动判断访问频率的高低难以实现,一个患者出院是否需要调用其病历资料完全是随机。
    2016-05-05
  • 高速磁盘的占比为5%-15%比较合适,这个观点去认同。
    2016-05-05
  • 如果一个患者出院,其病历资料长时间不被访问,存储设备会自动将其数据存放在低速磁盘上,不需要人工干预。这个可以存储自身可以根据访问的频率进行判断。
    2016-05-05
wwwdpwwwdp项目经理西安未来国际信息股份有限公司
医疗行业非结构化大数据存储选型建议要选稳定性好、成熟性、通用性和相对价格低廉的产品,因为相对来说大多数数据都不是热点数据,访问量要求都不是特别高的。显示全部

医疗行业非结构化大数据存储选型建议要选稳定性好、成熟性、通用性和相对价格低廉的产品,因为相对来说大多数数据都不是热点数据,访问量要求都不是特别高的。

收起
政府机关 · 2016-05-05
浏览2284

提问者

lzx660927
高级工程师/顾问浏阳市中医医院
擅长领域: 灾备存储服务器

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2016-05-04
  • 关注会员:8 人
  • 问题浏览:7396
  • 最近回答:2016-05-05
  • X社区推广