数据仓库建设的一点疑问

因为我从没有实施过数据仓库的建设,所以一直对数据仓库的建设原理不是很了解,但是自己自学一段时间以后感觉有那么点头绪了。
不过我有个疑问:
一家企业,我为他们做数据仓库建设。首先 他们是有自己的生产数据库系统的,以及其他系统。我帮他们在一台新服务器上建立一个数据仓库。就是把企业中的其他数据源的数据全部录入到数据仓库里。我第一次实施etl过程的时候,的确会把他们所有数据库里的数据录入数据库,但是过了一个生产周期,比如一天,一月,或者一个季度,他们生产数据库里的数据又有了新数据,这样的话我又得重新执行etl过程,再把所有数据库的数据录入到数据仓库。其实这是可行的,但是有问题的,因为只需要录入更新后的数据,而不是再次的全库刷新。而我找不到一个很好的办法来实施类似刷新的功能。
因为刷新的标志是不一样的,有些可能是根据时间戳来刷新的,但有些又不是。很麻烦,纠结中。有人能指点下么?
参与9

9同行回答

coslwlcoslwlETL开发工程师111111111
在设计ETL的时候应该考虑到时间维度的设计,ETL的抽取策略支持数据的增加,删除,修改的呀显示全部
在设计ETL的时候应该考虑到时间维度的设计,ETL的抽取策略支持数据的增加,删除,修改的呀收起
IT分销/经销 · 2012-03-15
浏览686
cognoszhangcognoszhang固定收益智能研究组临时负责人、大数据研究员天弘基金管理有限公司
lz问这个问题说明对数据仓库的基础都没搞懂。DW本身是数据库快照的集合,是含有历史的,这是MIS等系统不提供的功能,是要做时间拉链的显示全部
lz问这个问题说明对数据仓库的基础都没搞懂。DW本身是数据库快照的集合,是含有历史的,这是MIS等系统不提供的功能,是要做时间拉链的收起
基金 · 2011-03-04
浏览694
changcdchangcd项目经理ty-fly
jackeyaf1的做法好像很好,我们做的比较复杂,数据交换,有自己的工具。显示全部
jackeyaf1的做法好像很好,我们做的比较复杂,数据交换,有自己的工具。收起
互联网服务 · 2011-03-04
浏览670
luxiao1223luxiao1223软件开发工程师aia
我上面的完全刷新做法应该就是“一刀切”了,为了省事,感觉很无奈的。显示全部
我上面的完全刷新做法应该就是“一刀切”了,为了省事,感觉很无奈的。收起
互联网服务 · 2010-10-21
浏览674
hanjshanjs工程师东软集团
确实存在这样的问题,这个就需要根据具体业务具体分析了。不能一刀切。显示全部
确实存在这样的问题,这个就需要根据具体业务具体分析了。不能一刀切。收起
政府机关 · 2010-10-21
浏览658
luxiao1223luxiao1223软件开发工程师aia
感谢上面三位的回答。最近我也陆陆续续的看了些文档,发现网上对这问题也是一致的看法,棘手。因为业务数据库的数据有三种变更方式:新增了某些记录,删除了某些记录,更新了某些记录。而且这三种方式是组合形式的,也就是说一张表它可能既新增了记录,有删除了某些记录,那么对应的数据...显示全部
感谢上面三位的回答。最近我也陆陆续续的看了些文档,发现网上对这问题也是一致的看法,棘手。
因为业务数据库的数据有三种变更方式:新增了某些记录,删除了某些记录,更新了某些记录。而且这三种方式是组合形式的,也就是说一张表它可能既新增了记录,有删除了某些记录,那么对应的数据仓库也应该新增对应的记录和删除相关记录。其实4楼的说写触发器的做法可以解决部分问题,而不能解决所有情况。
不过我目前打算就是采用完全刷新的etl模式,就是每次都把数据仓库里的数据truncate掉,然后把所有业务数据库的数据进行入库。
虽然比较慢,但是简单,实用。况且数据仓库对实时性要求不高,我有大量的时间来更新数据仓库,我就让etl工具在那跑个几天,甚至是一个月。磁盘估计要接受很大的考验,不过我这样做主要是确保了数据的正确性。收起
互联网服务 · 2010-10-21
浏览698
jackeyaf1jackeyaf1软件开发工程师中国
在业务系统建立触发器,当有数据更新的时候,写入到自己建的某张表中。以后更新数据,可据此表做增量更新。显示全部
在业务系统建立触发器,当有数据更新的时候,写入到自己建的某张表中。以后更新数据,可据此表做增量更新。收起
软件开发 · 2010-10-19
浏览690
bans13bans13其他DHCC
1# _luxiao 维表可以一段时间重新导过一次,事实表可以利用时间戳获得变化数据显示全部
1# _luxiao
维表可以一段时间重新导过一次,事实表可以利用时间戳获得变化数据收起
政府机关 · 2010-10-18
浏览663
哥们 你说的情况 确实存在  先将老数据导进去 然后有新数据 不断地加入更新。也是我比较头疼的问题,你说能不能导入的老数据不懂 只对新数据进行刷新呢 这点经验不是很多显示全部
哥们 你说的情况 确实存在  先将老数据导进去 然后有新数据 不断地加入更新。也是我比较头疼的问题,你说能不能导入的老数据不懂 只对新数据进行刷新呢 这点经验不是很多收起
2010-10-18
浏览664

提问者

luxiao1223
软件开发工程师aia
擅长领域: 大数据商业智能

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2010-10-18
  • 关注会员:0 人
  • 问题浏览:4170
  • 最近回答:2012-03-15
  • X社区推广