您觉得适合医院非结构化数据存储和管理的架构应该是怎么样的?

参与26

3同行回答

s6dongs6dongit技术咨询顾问东软集团
医院的数据存储结构非常特殊,80%的数据为非结构化数据,来源于医疗影像CT、X光和多媒体医疗教学视频和图像文件等。传统医院的数据中心,大多数使用NAS文件存储用于非结构化数据的存储和管理。但是随着医疗非结构化数据的增加,NAS的一些弊端也逐渐显露出来。主要体现在如下方面...显示全部

医院的数据存储结构非常特殊,80%的数据为非结构化数据,来源于医疗影像CT、X光和多媒体医疗教学视频和图像文件等。传统医院的数据中心,大多数使用NAS文件存储用于非结构化数据的存储和管理。但是随着医疗非结构化数据的增加,NAS的一些弊端也逐渐显露出来。主要体现在如下方面:
1、NAS存储采用文件系统技术,单个文件系统容量受限,超过容量后对IT运维将带来巨大挑战
2、NAS存储的目录文件系统采用B+树进行文件索引,当文件数量过多时,会严重影响访问性能
3、NAS设备过维保后,由于非结构化数据规模较大,在更换时需要花费大量时间,且数据迁移存在风险等等。
相对于传统NAS文件存储而言,对象存储具有一些特别的优势。主要包括:
1、采用分布式架构,扩容更方便。

对象存储一般采用分布式架构。例如IBM Cleversafe或基于通用x86服务器+分布式对象存储软件的技术架构,对象存储软件将多台服务器通过以太网连接,构建成一个统一的存储资源池,可动态增加或删除服务器实现容量的调整,数据能够自动均衡,并且利用副本和纠删机制(类似于RAID5/6)实现数据的高可靠和高可用性。

2、解决海量小文件存储难题
由于传统NAS采用B+树进行文件检索,当文件数量比较少的时候,B+树基本可以被缓存,性能还是不错的。但随着文件数量的增多,B+树占用空间非常大无法被缓存时,就会涉及到机械盘操作导致性能明显下降,如果层级较深,仅仅索引访问就会产生多次磁盘随机访问操作,严重影响文件的访问性能。
而对象存储普遍采用了分布式哈希查找算法(DHT),在建立集群时,对象存储将整个存储空间划分成一个哈希环,每个磁盘负责哈希环中部分哈希分区的存储。当需要访问一个文件时,系统通过“目录/桶名+文件名”的哈希计算后,查询DHT表即可定位到具体磁盘进行文件访问。由于哈希环并不随文件数量的增加而增多,所以查找性能不会受到文件数量的影响。

3、满足医院业务生命周期存储需求
传统NAS存储采用文件系统技术,单个文件系统容量普遍在几十TB级。由于医院IT管理人员在业务上线前无法对规范容量和目录需求做出精准评估,对于某些产生数据量较大的业务系统来说,需要挂载多个文件系统目录,这会带来很多非增值的运维工作。
而对象存储采用扁平化的文件名唯一定位方式,单个目录或者存储空间能达到数十PB甚至数百PB级,可以满足业务系统整个生命周期的存储容量需求,无需挂载目录和调整业务系统,让医院IT人员更加关注业务价值本身。
4、适用于医院多数据中心容灾
大部分对象存储厂商都支持两个及以上的多数据中心容灾。通过纠删码技术将数据存储在不同的数据中心上。一个数据中心数据的丢失并不影响数据的完整性。传统NAS往往是主备模式的容灾,而对象存储普遍支持Active-Active模式的容灾,可实现本地数据中心应用的就近访问。

5、实现医院私有云和公有云间的数据流通
对象存储支持S33、SWIFT访问协议,可支持内网和外网应用系统对存储的自由访问。
在安全性方面,数据采用AES进行加密传输,支持HTTPS保证传输链路安全。S3协议还定义了完整的多租户访问、文件粒度的授权访问等多种安全技术,保证了数据开放给外网访问的安全性。

收起
互联网服务 · 2017-11-29
浏览2259
ibmfuqiangibmfuqiang系统架构师IBM
我觉得医院数据中心应该有混合的存储构架设计,分别针对结构化和非结构化类型的管理,建议存储数据分层管理,例如下图设计:Jietu20171129-151210.jpg显示全部

我觉得医院数据中心应该有混合的存储构架设计,分别针对结构化和非结构化类型的管理,建议存储数据分层管理,例如下图设计:
Jietu20171129-151210.jpg

Jietu20171129-151210.jpg

收起
系统集成 · 2017-11-29
浏览2463
hang0912hang0912技术经理苏州互盟信息存储技术限公司
可以采用在线—近线—离线分级数据存储策略,前端采用分布式NAS系统架构存储20%的常用数据、中间采用蓝光光盘存储,存储80%近线数据。处于近线的光盘库与客户医疗系统对接,当挂号系统检测到用户数据信息在存储上,HIS或PACS系统直接调阅用户数据,如果用户数据在近线存储上,这时光...显示全部

可以采用在线—近线—离线分级数据存储策略,前端采用分布式NAS系统架构存储20%的常用数据、中间采用蓝光光盘存储,存储80%近线数据。处于近线的光盘库与客户医疗系统对接,当挂号系统检测到用户数据信息在存储上,HIS或PACS系统直接调阅用户数据,如果用户数据在近线存储上,这时光盘库机械手直接将用户数据下载到在线存储上,使用光盘库可以节约存储空间不足,年年扩容的常态。
分级储存对不同性质的数据采用不同的储存和管理方式,可以降低数据储存的能耗,维护成本,极大地降低了系统的运营成本。此外,降低数据与系统之间的耦合程度,使数据安全得到保障。
磁盘阵列上分配:在线存储卷、备份存储卷。
用户日常应用在线存储卷,进行存储。
通过磁盘阵列的策略服务,进行从在线存储卷到备份存储卷中的指定目录备份。
BD(蓝光)存储:光介质近线、离线存储。
增加BD(蓝光)存储的新策略服务,将磁盘阵列中,备份存储卷中指定目录备份到光介质中;并自动在近线中显示已备份内容(自动升成索引目录)。
当备份开始时,策略服务将关闭备份目录的使用权限;在备份完毕时恢复原有使用权限。并将备份存储卷中指定目录内容清空(用以减少磁盘阵列的使用资源)。

收起
硬件生产 · 2017-12-05
浏览2245

提问者

gongjun
CIO上海仁济医院

问题来自

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2017-11-28
  • 关注会员:5 人
  • 问题浏览:5497
  • 最近回答:2017-12-05
  • X社区推广