容器云平台监控和容器应用监控主要使用Prometheus,告警可以通过Altermanager webhook方式对接自己外部的统一告警系统,rancher已经内置了Prometheus监控包含多个层面监控包括:集群层面资源使用监控和组件性能监控、节点资源监控、容器应用资源监控。对于一些需要针对业务的监控可以使用自定义监控方式实现对业务指标监控。
针对多集群的监控,rancher内集成了统一监控展示,将多个集群中的top信息进行统一展示如:最消耗cpu、memory的pod top10
一般情况下,与现有监控系统都是在监控指标展示层面进行对接,将数据通过统一的大屏进行展示。