数据集市、数据仓库在方法论上有什么差异,为什么选择不同的技术和平台?相比而言,数据集市和数据仓库各有什么优点和缺点?
数据仓库和数据集市的关系就像工厂与门店的关系,数据仓库用于存放着非常多的各类数据,而数据集市是把某些方面的数据包装对外服务的。所以数仓的数据全,粒度细,没有很好的加工,而数据集市可能会改变原有数据,所以粒度是较粗的。数据仓库的优点是数据全面,但是分析时效性慢,而数据集市更关注于时效性和应用场景,不关心数据本身的结构。
本质上没有区别,如豪华汽车和中端汽车,目的是解决不同场景的问题。数据集市(Data Mart) ,也叫数据市场,是企业级数据仓库的一个子集,是为满足特定的部门或者用户的需求,只面向某个特定的主题,数据集市存储为特定用户预先计算好的数据,从而满足用户对性能的需求。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。数仓解决海量数据统计分析,低用户并发,大量计算。数据集市低延时和高并发查询的情况下具备足够的支撑能力,可以7×24对外提供数据服务,且不影响原有数据仓库统计分析应用的正常运行。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30