数据集中平台数据量大且繁杂,其中信息价值也比较高,如果能够对其进行有效的存储、处理、查询和分析,那么就可为医生做出更为科学和准确的诊断,或者帮助研究新的医疗方法。然而,如何将海量、复杂的数据的存储、处理和保护成本降至最低,同时还能对此进行实时或准实时的处理、查询和响应?
结构化数据,可以考虑ibm svc+flashsystem的方式,热点数据自动easy tier至闪存上,非热点数据放在普通盘上,既保证性能又保证资产价值。
非结构化数据,可以考虑IBM 的 gpfs,属于海量数据存储方案,如影像数据,可在线不断增加空间,属于PB级方案。
收起分级存储只能解决访问效率和数据存储成本问题,并不能解决用户数据整合需求。医疗行业用户数据孤岛比较多,单一的存储虚拟化整合和分层存储并不能很好的解决,还得从用户业务分析上入手,改变用户数据交换和存储数据结构,然后再进行数据整合。
目前很多医院的IT兄还挺溜在按不同业务分别部署的分散式方式,这是由于组织管理等条件逐步形成的延续方案。 但这种方式对IT系统的成长、管理的弊端是显而易见的。因此也有很多思想成熟的医院开始进行数据集中的工作。
需要注意的是,数据(IT)系统是否能够集中,是和医院的组织、管理架构息息相关的。 如果不能打破医院科室、业务的藩篱,紧靠IT部门
是做不到数据集中的。
对于数据集中的实现方式,IBM和合作伙伴已经有了一些大型医院的经验。 这首先要从系统的调研、规划、设计开始。对于各科室、专业的
业务系统特点进行分类,再进行统一的规划。比如计算密集型、I/O密集型、数据密集型的不同业务应用,如何削峰填谷充分利用资源,又能
充分保证系统的稳定性、灵活性、可维护性。这些是要在做具体项目的时候要首先考虑的。 至于具体的技术实现,IBM有很多成型方案可以
帮助合作伙伴和客户。
医疗数据类型较多,有结构化数据也有非机构化数据(其中也包括大量的影像数据)。 对于这些数据,我们既应该考虑到业
务系统对于高可靠、高性能的要求,也要同时兼顾成本要求。 因此采用不同的数据存储资源池、存储分层和数据生命周期管理的整体思路解
决这类问题是比较合适的。 比如用Spectrum storage的系列软件实现存储生命周期管理和统一监控。同事对于图片、影响等数据,可以使用
Spectrum scale的方案构建低成本、高可用的、高灵活性的存储资源。
收起个人理解,这个问题主要涉及的并不单纯在存储,而主要关注数据获取与使用的两端。针对医疗IT领域的技术实现及医疗海量数据本身的价值,在业内都还存在分歧,不过已经有些许尝试摸索,可供各位同仁借鉴:
1、集成平台的建设
2、BI数据挖掘分析
集成平台的建设,是BI得以开展的基础,实现数据的清洗、上传、存储、流转。国内医疗IT领域对集成平台的认知,大约始于2011年前后的区卫信息化建设,之后又有所发展,到如今一个主要的认知共识为:以EMR为中心,通过集成平台建设实现院内各医疗信息化系统的数据层面交互,为此制定了相应的数据集等标准。在技术实践中,特别是中间件技术中,orion渐脱颖而出。在案例中,以我个人了解,北方何雨生老师就任期间的中日友好医院,以及南方深圳的港大医院,集成平台建设与应用较具代表性。以承建方来看,昙花一现的凯歌(后解体,目前凯华有继承),以及北大医信值得推荐。从咨询机构方面看,埃森哲是首选。
BI数据挖掘分析,则目前的市场割据态势不明,专业面向医疗行业分析应用的案例还较少,目前的建设中着重突出的还是面向管理层的决策分析。而针对医疗病种分析、疾病统计等,还比较的少。如果硬要从BI承建方考虑,我个人投永洪1票。
此外,对亚健康、慢病监管所产生的生理体征数据,是否有价值,如何存储、使用,还是一个争议话题。
收起