业内大数据平台建设的方向是存算分离、批流一体化,存储不在是简单的数据存放,更要结合大数据系统的业务模型,减少数据流动、降低数据副本数、考虑历史数据生命周期归档长期在线可访问等,Dell Isilon+ECS 数据湖解决方案就是不错的选择,后续线下可详聊
收起目前看到大数据平台或者数据中台都有比较成熟的产品,基本是分布式架构,产品本身都是一站式的解决方案。其中大数据平台可提供数据采集、加工和分析等全套构建服务,架构特点是横向扩容相当便利,冷热数据是分离的,初期按照数仓容量的规模和历史数据的保存周期去评估问题应该不大,就算无法准确评估容量,后期按照集群方式去扩容即可,随着规模的增大,机房机柜的容量也是需要关注的问题。
收起