大数据框架组件的监控,可以复用容器平台原有对于在线容器的基础监控能力,并增加一些组件应用特性的状态类监控指标。 作业层面,复用原有大数据作业的监控逻辑,监控队列里的作业状态,以及某一时间段(比如30分钟内)的作业失败率,超出预期则发出告警。...
如何实现业务容器与大数据容器的混合调度部署,两者的调度器的逻辑如何进行统一,以达到在保证安全生产的前提下,充分利用集群资源,降本增效 。针对这个话题我谈谈我的建议:大数据作业通常需要独立的调度器,和在线业务的调度器独立,因为二者的调度逻辑有很大的差异。在线业务用缺...
关于大数据容器化会有比较专业的厂商或是业界比较成熟的方案 ,我也谈谈我在大数据和容器结合的一些实践经验给你参考:可以根据自己的实际情况和需要选择。 但是前提是在线单集群的规模要足够大,单个节点的规格要足够高(最好是物理机)并且配置本地shaffle文件系统,这样才能承载...
大数据平台容器化后底层容器使用的还是k8s这一套,这个并没有改变。 技术方案方案一般有2大类: 一个大类是用k8s模拟yarn调度模式、一个大类是k8s原生调度方式。spark/flink社区主要支持k8s原生调度方式,我们因为历史原因选择用k8s模拟yarn调度模式。大数据容器化只有和混...
大数据平台容器化混合部署,扩容弹性较云化+分布式存储相比的优势和提升在什么地方 ?针对你这个话题,我是这样的思考,你可以看看是否有解答:容器相比云化虚机,弹性能力是数量级的提升。大数据容器化后做混合部署,可以复用容器的弹性能力,实现大数据作业的serverless化,即无需为大...