针对结构化与非结构化或半结构化的统一存储到数据湖,因医疗行业信息化发展多年,业务流程、数据标准已有相应的国家级规范,但是我的理解数据入湖带来的最大灵活性,数据不需要通常预先定义 schema,那么应用层带来的存储系统访问、权限管理、业务模型的标准化层面,需要单独来处理,因为我的理解,数据湖架构太过灵活而缺少对数据监管、控制和必要的治理手段,导致运维成本不断增加、数据治理效率降低,企业落入了『数据沼泽』的境地,即数据湖中汇聚了太多的数据,反而很难高效率的提炼真正有价值的那部分,最后只能再次迁移到数据仓库设定数据平台,才能解决运维、成本、数据治理等问题,我想了解Dell的大数据平台,在提供强大的计算/存储引擎的同时,针对影像、语音等灵活的非结构化数据与标准诊疗业务流程的结构化数据之间怎么有效的融合与一体化管理/治理,而不是说让医院搞一个Hadoop数据湖之后,需要再上一套数据仓库的解决方案,这样增加医院的维护成本,或者说再PASS平台层的解决与推荐方案?
收起