活动简介
随着医疗信息化的不断发展和创新,除了传统的HIS、LIS、PACS、EMR等业务系统的建设外,越来越多的医院正在经历和开展数字化转型,我们正在接触和尝试云技术、移动医疗、互联网和大数据应用。医院的信息化应用,每天都会产生大量的医疗数据,从数据量来看,只有不到20%的数据为结构化数据,其余大部分均为非结构化数据,尤其是PACS医学影像数据。每年各种医疗检查所产生的影像文件,如CT、MR、超声、内镜等,多达数十TB,而且随着医疗设备技术的发展和检查手段的进步,,在提升医疗水平的同时也会导致更大量的非结构化数据的产生,随之而来面对的问题就是如何将这些非结构化数据合理、安全、无所损失的保存和高效的利用。
存:怎么存? PACS数据有三个重要特点:很小、很多、很大。很小:一般PACS 文件的大小平均在200k-500k左右;很多:PACS文件数量相当多,几十TB的存储量就可达上亿的文件数量;很大:上百TB的PACS存储量在三甲医院里不在少数。
我们说“存”不是找个阵列把数据放进来就完事了,关键是如何保证数据不丢失。但要怎么才能保护好这些数据,是令很多医院信息科头疼的事情。传统的备份手段,比如通过备份软件加磁带库或者虚拟磁带库,根本无法应对如此海量文件的备份处理,光扫描一遍文件系统就需要等待漫长的数个小时时间。目前,很多医院的PACS数据的备份机制并不完善,一旦发生物理故障或者人为误操作,导致数据丢失,基本就很难找回失去的数据了。
管:如何管?PACS数据每年不断递增,按照临床的要求和医疗政策的规定,影像数据要保留至少15年或更长时间,绝大多数医院都会永久保留这些数据。而从实际使用的角度来看,PACS中相对活跃的数据一般在1-2年内,而大量的历史数据大多属于很少被访问的静态数据。活跃数据需要满足一定的访问性能要求,而静态历史数据更多的注重安全长期保存。如果都混在一起,即要满足性能要求又要满足安全性要求,就需要采用高性能高安全性且大容量的存储设备了,一般来说都是高端存储了,这样成本投入和维保费用都太高,还要考虑灾备的问题,那又是一笔高昂的费用。所以还是要区别对待,按照数据的生命周期对应采用不同类型的存储设备和方式,才是合理的解决之道。这里还有一个问题,存储设备这里硬件设备自身也是有产品生命周期的,一般一台存储阵列用个5-8年基本就要更新换代了,买个新存储回来又会涉及到一个问题就是如何把数据从老旧的存储设备里面迁移到新购的存储,几十TB甚至上百TB的数据迁移也是极其费时费力的,还有反复的来回比对,迁移过程中万一有个误操作什么的,极易导致数据丢失。
我们也在了解存储市场和关心存储技术,现今,对象存储正在处于快速增长期,我们更多的接触和了解对象存储可能是从互联网厂商、云服务商开始的,比如亚马逊AWS、阿里云等都提供对象存储服务。对象存储相对于传统的SAN存储和NAS存储,更侧重于数据的安全性、合规性和长期性。对象存储具有很高的自我保护能力,可以防止从逻辑到物理的一切错误,这样就可以不需要再通过备份软件磁带库之类的做备份了,而且数据还是实时在线的,随需随取,非常适合将医院的PACS静态数据保存在对象存储上,减少备份的成本投入。但不同厂商的对象存储各有不同,这块还需要结合自身实际情况选型。而PACS的活跃数据则可以继续采用高性能的SAN或者NAS存储来满足快速调阅的需求。两者结合,相辅相成,构成完整科学的PACS数据生命周期管理。
问题1:
您所在医院目前是否存在非结构化数据的存和管问题?
问题2:
您当前是如何对非结构化数据进行保护的?您觉得您使用的保护手段真正有用吗?
问题3:
您了解过对象存储吗?您对于公有云和私有云是怎么看的?
问题4:
您觉得适合医院非结构化数据存储和管理的架构应该是怎么样的?
嘉宾介绍
刘东 it技术咨询顾问 东软集团
目前在东软集团股份有限公司担任首席技术顾问,主要负责数据中心IT系统架构设计,云计算中心IAAS层架构设计,容灾解决方案体系建设;具有10年以上技术支持和系统集成工作经验,对金融、医疗、能源和政府等行业的解决方案有独特的见解。