改造后的运维体系将做何种调整,大数据监控与容器监控是否可以做到统一、精确,实现有效的反馈机制,保证业务稳定运行
大数据框架组件的监控,可以复用容器平台原有对于在线容器的基础监控能力,并增加一些组件应用特性的状态类监控指标。 作业层面,复用原有大数据作业的监控逻辑,监控队列里的作业状态,以及某一时间段(比如30分钟内)的作业失败率,超出预期则发出告警。
关于TWT使用指南社区专家合作厂商入驻社区企业招聘投诉建议版权与免责声明联系我们 © 2024talkwithtrend — talk with trend,talk with technologist京ICP备09031017号-30