总问题:数据集市中有大量数据时,数据之间的关系应该怎么管理呢?场景问题:面对大量的数据集市中的数据,有可能针对同一个属性从不同的表里得到是存在不一致的情况的。这种情况怎么处理?
这需要两方面:1、充分理解业务场景,进行元数据管理,定义各表中各字段的业务含义2、加强数据治理,在数据ETL时对业务系统数据进行按照元数据规则进行预处理。
这个也是数据分析时遇到的共性问题,数据仓库同样由此问题,通常的做法就是建立元数据标准,在数据ETL的时候进行标准化处理,避免数据不一致的情况。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30