企业应该如何利用 Prometheus 对 OpenShift 集群进行监控?

1回答

zzhengleizzhenglei  技术经理 , 太平洋保险
zhuhaiqiang赞同了此回答
上图整理了OpenShift 集群的监控需求。它包括两大部分: 一部分是对OpenShift 平台进行监控,确保它稳定运行。这是平台运维团队的需求。这部分又包括很多内容,包括节点监控(节点的CPU、内存、网络、存储等)、容器监控(每个容器所消耗的资源,包括cpu、内存、网络、文件系统等),以及 ...显示全部


上图整理了OpenShift 集群的监控需求。它包括两大部分:

一部分是对OpenShift 平台进行监控,确保它稳定运行。这是平台运维团队的需求。这部分又包括很多内容,包括节点监控(节点的CPU、内存、网络、存储等)、容器监控(每个容器所消耗的资源,包括cpu、内存、网络、文件系统等),以及 OpenShift 核心组件等。
另一部分是运行在OpenShfit 平台上的业务服务,确保业务服务稳定运行,这是应用开发和运维团队的需求。

基于 Prometheus 的 OpenShift 监控系统的实现

为了满足上述监控需求,OpenShift 提供了基于 Prometheus + Grafana 的监控系统。针对每个需要被监控的目标(target),都利用了Prometheus提供的某个功能来实现对它的监控。

逻辑图如下:

收起
 2020-02-05
浏览323

提问者

hwrr系统架构师, 某银行

问题状态

  • 发布时间:2020-02-05
  • 关注会员:2 人
  • 问题浏览:1566
  • 最近回答:2020-02-05