查看其它 2 个回答s6dong的回答

s6dongs6dongit技术咨询顾问东软集团

医院的数据存储结构非常特殊,80%的数据为非结构化数据,来源于医疗影像CT、X光和多媒体医疗教学视频和图像文件等。传统医院的数据中心,大多数使用NAS文件存储用于非结构化数据的存储和管理。但是随着医疗非结构化数据的增加,NAS的一些弊端也逐渐显露出来。主要体现在如下方面:
1、NAS存储采用文件系统技术,单个文件系统容量受限,超过容量后对IT运维将带来巨大挑战
2、NAS存储的目录文件系统采用B+树进行文件索引,当文件数量过多时,会严重影响访问性能
3、NAS设备过维保后,由于非结构化数据规模较大,在更换时需要花费大量时间,且数据迁移存在风险等等。
相对于传统NAS文件存储而言,对象存储具有一些特别的优势。主要包括:
1、采用分布式架构,扩容更方便。

对象存储一般采用分布式架构。例如IBM Cleversafe或基于通用x86服务器+分布式对象存储软件的技术架构,对象存储软件将多台服务器通过以太网连接,构建成一个统一的存储资源池,可动态增加或删除服务器实现容量的调整,数据能够自动均衡,并且利用副本和纠删机制(类似于RAID5/6)实现数据的高可靠和高可用性。

2、解决海量小文件存储难题
由于传统NAS采用B+树进行文件检索,当文件数量比较少的时候,B+树基本可以被缓存,性能还是不错的。但随着文件数量的增多,B+树占用空间非常大无法被缓存时,就会涉及到机械盘操作导致性能明显下降,如果层级较深,仅仅索引访问就会产生多次磁盘随机访问操作,严重影响文件的访问性能。
而对象存储普遍采用了分布式哈希查找算法(DHT),在建立集群时,对象存储将整个存储空间划分成一个哈希环,每个磁盘负责哈希环中部分哈希分区的存储。当需要访问一个文件时,系统通过“目录/桶名+文件名”的哈希计算后,查询DHT表即可定位到具体磁盘进行文件访问。由于哈希环并不随文件数量的增加而增多,所以查找性能不会受到文件数量的影响。

3、满足医院业务生命周期存储需求
传统NAS存储采用文件系统技术,单个文件系统容量普遍在几十TB级。由于医院IT管理人员在业务上线前无法对规范容量和目录需求做出精准评估,对于某些产生数据量较大的业务系统来说,需要挂载多个文件系统目录,这会带来很多非增值的运维工作。
而对象存储采用扁平化的文件名唯一定位方式,单个目录或者存储空间能达到数十PB甚至数百PB级,可以满足业务系统整个生命周期的存储容量需求,无需挂载目录和调整业务系统,让医院IT人员更加关注业务价值本身。
4、适用于医院多数据中心容灾
大部分对象存储厂商都支持两个及以上的多数据中心容灾。通过纠删码技术将数据存储在不同的数据中心上。一个数据中心数据的丢失并不影响数据的完整性。传统NAS往往是主备模式的容灾,而对象存储普遍支持Active-Active模式的容灾,可实现本地数据中心应用的就近访问。

5、实现医院私有云和公有云间的数据流通
对象存储支持S33、SWIFT访问协议,可支持内网和外网应用系统对存储的自由访问。
在安全性方面,数据采用AES进行加密传输,支持HTTPS保证传输链路安全。S3协议还定义了完整的多租户访问、文件粒度的授权访问等多种安全技术,保证了数据开放给外网访问的安全性。

互联网服务 · 2017-11-29
浏览2268

回答者

s6dong
s6dong1729
it技术咨询顾问东软集团
擅长领域: 存储服务器灾备

s6dong 最近回答过的问题

回答状态

  • 发布时间:2017-11-29
  • 关注会员:5 人
  • 回答浏览:2268
  • X社区推广