您是一个比较专业的用户,数据仓库平台建设来讲,建议以下方面的观点: 首先建设数据仓库不应该是由于数据量的增长,数据仓库是一个业务和技术相结合的产物,由业务需求驱动,建设才有意义. 针对您提出的五个问题,我做以下解答: 1) 数据仓库产品的选择,这个是很多企业最关心最...
显示全部您是一个比较专业的用户,数据仓库平台建设来讲,建议以下方面的观点:
首先建设数据仓库不应该是由于数据量的增长,数据仓库是一个业务和技术相结合的产物,由业务需求驱动,建设才有意义. 针对您提出的五个问题,我做以下解答:
1) 数据仓库产品的选择,这个是很多企业最关心最纠结的东西,从我们做过的案例来讲,我们推荐客户尽量选择自己熟悉的产品,使用自己身边的产品,技术的跨度对项目来讲影响是非常大的.同时也要考虑成本,当然如果您对成本无所谓,选择的就更多了.目前市场上比较全面的数据仓库产品有IBM,Teradata等,这两家的产品线最全,当然Oracle也很强大,SQL Server最近几年发展也不错,综合各个方面,建议选择IBM的数据仓库产品,如果您的业务系统是基于DB2的,那就更好了.
2) 这个问题就看您是应用驱动,还是数据驱动,如果是应用驱动,就是自上而下,毕竟应用最清楚需要什么样的数据支撑;如果数据驱动,那就自下而上,先从数据如手,再考虑上层应用,这将是一个企业级的数据仓库平台.无论乃个方案,从建设过程来讲都是一个分阶段推进的项目,采取自上而下的建设过程是比较合理的,也能将风险降到最低,但需要全面的详细的规划.
3) 是否采用NOSQL,取决于您的数据源和最终应用, 无论是NOSQL还是关系型数据库,都能实现您的目标,如果您对NOSQL比较熟悉,可以选择相关的产品,如果不熟悉,参考第一条,选择关系型数据库是最好的方案.
4) ODS/UDM是数据仓库建设过程中的其中一个路径而已,实际上是代表了数据仓库系统中对数据的逻辑区域划分,我们通常讲数据仓库成为EDW,企业级数据仓库平台,ODS/udm是其中的逻辑数据区,架构规划会设计这部分.
5)数据仓库的建模,不同的数据区根据应用目标要集合使用,比如ODS,贴源设计,采取宽表是很合理的;EDW中SDM可以采取3NF设计,因为必须按主题域设计,要融合不同源系统的数据,3NF是最合理的;DM(数据集市)、汇总数据区采取多维建模是合理的,因为他的数据来源于SDM,存储的是汇总、计算后的数据,采取多维模型设计更贴近应用需求,同时性能也是最高的。
以上观点,欢迎讨论,如有错别字还请见谅啊 ! :)
收起