传统的数据架构是以数据仓库为中心,形成数据采集->数据整合->数据展现->数据挖掘。大数据时代以Hadoop为代表的大数据技术很好的将数据仓库进行了保值扩容,基于其上形成了一个新的生态圈。随着实时计算和离线计算的出现一种Lambda架构变得流行...
如果业务强调高吞吐,高并发,那需要存储上调配比较优质的资源给它,设置QOS和缓存分区为这个业务做定制优化。满足虚拟化需求的话,则要看存储上有没有这个功能,一般高端的都有。EMC的FTS,IBM的V系列等。...
听专业人士分析淘宝网的海量数据存储与管理以及海量数据的高效存储 --- 淘宝云梯极限存储的原理和实践;大量文件可供下载!