传统的数据仓库是结构化数据处理、批量数据ETL、离线计算、报表查询、OLAP分析;大数据在分布式架构,数据存储,非结构化数据和实时数据处理等方面占有优势。
大数据时代下数据平台的建设,如何取长补短,充分发挥各自的优势。
大数据平台的概念应该包括数据仓库,也就是说数据仓库应该做为企业大数据平台的一部分,而不是互斥的关系。而Gartner提出的LDW(Logical Data Warehouse)也是大数据平台概念的一个延伸。这里说的大数据平台更像是一个狭义的概念,特指Hadoop。
Hadoop和传统数仓的定位是不同的: