整个平台有哪些监控的问题可以考虑1.容器云平台底层的监控,例如底层的服务器的存储、网络、CPU、GPU、电路等的监控。2.就是平台底层实现服务的监控,这里一般指K8S相关指标监控如kubelet/apiserver/docker/etcd/kube-controller-manager等核心组件的运行状态。3.在上面一层就是运行业务的容器的监控,监控容器的cpu/memory/disk/network等指标,这些监控可以从docker daemon获取,或者查看伪文件系统,分析cgroup的相关指标进行计算。4.在在上面就是各应用的监控咯,这层就是各应用的一些业务指标,例如用户访问量等可用性指标。
监控工具上,可选择开源的 promethus 然后加上各种插件进行大屏展示,自研也可以,不过做好的成本较大。