实时数据仓库与传统数据仓库的融合:1)实时数据仓库与历史数据仓库是否考虑统一建模还是分开建模?2)实时数据仓库的实时数据与历史数据仓库的历史数据是统一存储还是分开存储?
这其实是一个问题。传统数据仓库反映长时间的变化,最细区分粒度是以天为周期的。历史库只不过是将久远的,利用率低的数据单独剥离存放了。 实时数仓是为了对当前时刻的业务进行一系列统计,其初衷是为了解决两个基本问题。一是将复杂的统计计算从业务系统剥离,给业务系统减负;二是实现跨系统数据加总和关联。 实时数仓解决问题的重点在汇总或关联,其对效率的要求比较高。所以需要用与传统数仓不同的策略进行设计。也就是分开模型,分开存储比较合适。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30