1、梳理院内数据情况,清楚搭建大数据应用的迫切需求,比如数据多、分散、数据不标准、数据没有发挥价值用于提升医院运营和病患看病过程。只有了解到院内现有的痛点,才能有针对性的解决问题。
2、搭建大数据集群,重要的是保证平台的稳定性,这需要长时间的管理经验积累,相关人员可以多研究各种技术组件,多多实践。
3、实现数据的生命周期管理,包括采集、存储、分析处理、可视化几个层次,每个层次都有若干技术点,相互配合才能最终发挥数据真正的价值。每个层次的技术点很多,可以查阅hadoop生态圈和spark生态圈相关技术,学习成熟的解决方案。