数据集中平台是将原有的系统中的数据整合起来,还是新建一套包含原有功能的大型医院系统?是否已有案例分享?
另外,在整合或者建设的同时,安全和可靠是应该如何考虑?从哪些方面入手
数据平台的最终目标是所有的数据全部进入数据集中平台,这个是一个漫长的过程,可以在初期移植部分功能或者部分功能的数据进入数据集中平台。经过1-3年的转化后,数据全部进入集中平台。由数据集中平台对外提供统一的数据服务。底层搭建可以选择Hadoop+HBase的组合。
目前很多医院的IT兄还挺溜在按不同业务分别部署的分散式方式,这是由于组织管理等条件逐步形成的延续方案。 但这种方式对IT系统的成长、管理的弊端是显而易见的。因此也有很多思想成熟的医院开始进行数据集中的工作。
需要注意的是,数据(IT)系统是否能够集中,是和医院的组织、管理架构息息相关的。 如果不能打破医院科室、业务的藩篱,紧靠IT部门是做不到数据集中的。
对于数据集中的实现方式,IBM和合作伙伴已经有了一些大型医院的经验。 这首先要从系统的调研、规划、设计开始。对于各科室、专业的业务系统特点进行分类,再进行统一的规划。比如计算密集型、I/O密集型、数据密集型的不同业务应用,如何削峰填谷充分利用资源,又能充分保证系统的稳定性、灵活性、可维护性。这些是要在做具体项目的时候要首先考虑的。 至于具体的技术实现,IBM有很多成型方案可以帮助合作伙伴和客户。
单纯的Hadoop平台并不适应医院的所有业务。要根据不同业务的特点进行统一规划。 将现有业务系统梳理、整合,重新规划。 适合结构化数据的内容与非结构化数据如何处理,计算资源、存储资源,系统软件、中间键等统一规划才可
大数据是建立在大量数据、大量来源、大量数据种类的特点之上的,且80%的数据是非结构化数据。再次基础上,首先要完成的数据收集、数据存储、数据管理,然后更需要根据实际需求进行系统的数学分析、建模等工作。这是一个非常复杂的工作,尤其是对于医院的各种医疗数据(包括图片数据)。
我其实还是建议按照业务不同 分散部署,分散存储。因为科室和部门不同,对数据访问的敏感程度也不同。对于访问量大的 如预约挂号 就可以单独使用一个节点去保存。至于数据 完全可以通过后期的数据仓库,数据挖掘,在一个独立的节点上整合到一起。
不需要把所有的资源信息都放在一个节点上,一旦出问题全部停业。
收起