传统的数据仓库,可能通过一些传统数据库比如oracle mysql等,这些数据库做成超大型的数据中心,可谓存在很多地方都得自己手动去维护,比如说oracle,oracle其实是没有集群这个概念的,你硬是要通过多个实例构成一个大型数据仓库,那这中间数据的一致性怎么保证?这得 你自己去想办法,虽然oracle底层有这个机制,但是如果你了解现在大数据数据中心采用的hadoop作为底层存储的方案,你会发现很省事。另外一个可扩展方面,比如你有了个hadoop集群,那你以后想上hive处理离线数据集群,spark实时处理数据集群,都是很方便的,而且这些新兴的技术比传统的去写一些存储过程好维护多了
收起