wangchengwen
作者wangchengwen2015-10-16 13:59
系统分析师, wangchengwen

数据集市的构建方法

字数 664阅读 3696评论 0赞 0

1、构建数据集市的一般方法

通过ETL工具将业务系统中的源数据抽取到数据仓库中,再经过多次的数据抽取、清洗、转换、加载,最后汇总到数据集市中,从而保证数据一致性,有利于构建各部门级别的决策分析系统。

这种方法特点是开发周期相对较长,开发成本也比较高,不易于针对用户的意见做及时修改,灵活性相对较差,但是他的数据质量高,并且能够保证数据的一致性和完整性。

2、构建数据集市的特殊方法

先设计和开发小部门级别的数据集市,然后再通过逐渐递增的方式慢慢扩大数据集市的规模,最后将各个数据集市集成到数据仓库中。

这种方法开发周期较短,开发成本较低,能针对用户意见及时进行修改和调整,不仅增加了开发的灵活性,而且能源数据到数据仓库的抽取效率。但是这种方法有一定的局限性,首先从数据集市集成到数据仓库中,会因为业务规则的不同和数据格式的不一致性,而增加了集成难度。其次,由于数据集市的增多,用户进行必要的关联查询和交叉查询,会增大数据集市 之间关联的复杂度,从而影响数据集市集成到数据仓库的效率。

3构建数据集市的混合方法

首先根据业务需求,业务源数据经过ETL过程将数据抽取到企业的数据仓库,数据仓库存储了大量的历史数据、汇总的数据和共享的数据,同时部门级别的数据集市经过ETL过程直接从源数据中抽取数据,并且加载到数据集市中。

这样各部门的决策分析者可以直接从数据集市或缺决策信息,并能迅速作出决断。数据 集市中有一部分数据经过汇总或者计算,直接将历时数据或共享数据加载到数据仓库中,这样既减少了开发成本,同时又保证数据的一致性,并且能够满足决策者的需要

如果觉得我的文章对您有用,请点赞。您的支持将鼓励我继续创作!

0

添加新评论0 条评论

Ctrl+Enter 发表

作者其他文章

相关问题

相关资料

X社区推广