需要解决的问题,结合这个问题,我谈谈我的想法
数据量庞大。区域卫生数据中心以城市为单位,将存储健康档案、电子病历、卫生管理三大数据库,作为 300 万人口的中等规模城市,其卫生数据中心的规模在20 年后预计会达到 PB 级传统关系型数据在大数据存储实现中存在局限性,在一张表中存储 500GB 之上的数据存在性能方面的问题。
数据类型复杂多变。区域卫生数据中心,将会存储大量的非结构化数据和半结构化数据。如果采用传统关系型数据库,则面临众多不易解决的问题:PACS 影像,B 超、病理分析等业务产生的非结构化数据大小不一,从数百 KB 到数百 MB 都有,病人的一次诊断活动中需要存储、调阅数百张影像数据;由于医疗卫生行业的业务复杂性,很难制定统一的数据标准,这就给数据访问和交换带来新的挑战。
另外,未来的数据处理也将面临巨大挑战,譬如未来海量数据的存储,备份,扩容等,快速的检索特定数据,以及高效的数据交换等等。
实施后的效果:
海量数据存储:应对超过一亿条记录(文档)的存储需求
数据格式动态扩展:Hbase 提供的列式存储方式,可以轻松应对数据格式的灵活调整
海量数据快速检索:高并发的并行海量数据检索,满足居民和医生实时检索健康档案的需要
统计分析:开放的统计分析框架,接近实时的统计分析能力
平滑扩容:横向扩展性能卓越,应对未来业务和数据量的不断增长
使得医生可以快速检索就诊患者的个人基本信息、既有病史、就诊及处方等重要信息,通过辅助信息,帮助医生做出更准确的诊断,并且有效避免重复用药、药物不良反应等