1、数据湖的数据范围要看具体的规划,一般企业会建立历史数据查询存储平台,逐步将业务系统的历史数据,如交易流水等,逐步迁移至历史数据查询存储平台,由平台承接所有历史数据查询业务。2、数据湖中数据一般存储为宽表的形式,以便于提升查询性能,可以在日终加载时将业务系统产生的...
显示全部1、数据湖的数据范围要看具体的规划,一般企业会建立历史数据查询存储平台,逐步将业务系统的历史数据,如交易流水等,逐步迁移至历史数据查询存储平台,由平台承接所有历史数据查询业务。
2、数据湖中数据一般存储为宽表的形式,以便于提升查询性能,可以在日终加载时将业务系统产生的生产数据加工为宽表,加工数据的口径应根据具体查询业务的口径确定。
3、可由独立团队负责数据湖建设、维护,该团队一般归属于大数据部门,团队内部可分为数据治理岗、数据需求分析岗、平台设计开发岗、运维岗等。
收起