医疗行业非结构化大数据存储策略的选择?

医疗行业非结构化数据,数据量大而且增速大,但随着时间的推移,并发访频率逐渐降低,因此一般采用分级存储技术,目前分级存储设计发展为在线存储、近线存储、离线存储,那么我的问题是,有没有一种算法,确定多久的数据适合在线存储,多久的数据适合近线存储,多久的数据适合离线存储才比...显示全部

医疗行业非结构化数据,数据量大而且增速大,但随着时间的推移,并发访频率逐渐降低,因此一般采用分级存储技术,目前分级存储设计发展为在线存储、近线存储、离线存储,那么我的问题是,有没有一种算法,确定多久的数据适合在线存储,多久的数据适合近线存储,多久的数据适合离线存储才比较科学?

收起
参与41

查看其它 2 个回答s6dong的回答

s6dongs6dongit技术咨询顾问东软集团

目前的中高端存储大多支持自动分层技术,即自动判断访问频率的高低,然后将经常访问的“热点”数据自动存放在高速磁盘上,将不经常访问的“非热点”数据自动存放在低成本低速的磁盘上。

要实现自动分级存储需要在存储产品购买和配置选型时做好规划,例如购买一部分SSD高速磁盘,再购买一些SATA或SAS磁盘作为低端存储介质。一般高速磁盘的占比为5%-15%比较合适,可以提供比较好的性价比。

关于多久的数据适合做离线存储,这个要根据医疗行业单位自身的情况和规定进行确定,例如HIS数据需要长期保持在线,一般医院要求临床数据至少要保留三年等,要看具体情况具体分析。建议在数据中心配置一个虚拟磁带库,用于近线数据保留和规定,然后再配置一个物理磁带库,对于超过保存期限的,需要离线保留的数据进行归档保存。

互联网服务 · 2016-05-05
浏览2754
  • 我认为自动判断访问频率的高低难以实现,一个患者出院是否需要调用其病历资料完全是随机。
    2016-05-05
  • 高速磁盘的占比为5%-15%比较合适,这个观点去认同。
    2016-05-05
  • 如果一个患者出院,其病历资料长时间不被访问,存储设备会自动将其数据存放在低速磁盘上,不需要人工干预。这个可以存储自身可以根据访问的频率进行判断。
    2016-05-05

回答者

s6dong
s6dong1729
it技术咨询顾问东软集团
擅长领域: 存储服务器灾备

s6dong 最近回答过的问题

回答状态

  • 发布时间:2016-05-05
  • 关注会员:8 人
  • 回答浏览:2754
  • X社区推广