请问容器云平台监控时,应该监控哪些项,而这些项又是如何对应相关运行状态?
另外,关于容器监控工具,是否promethus更合适,有没有别的选择推荐?同时是否有一个统一的监控平台能够对容器,传统IaaS等提供监控支持服务。
关于监控项,可以从两方面考虑
1、容器云平台自身服务的监控,比如监控kubelet/apiserver/docker/etcd/kube-controller-manager等核心组件的运行状态;
2、容器云上面的业务容器监控,类比虚机,监控容器的cpu/memory/disk/network等指标,这些监控可以从docker daemon获取,或者查看伪文件系统,分析cgroup的相关指标进行计算。
监控工具上,开源的 promethus 比较合适,适合云容器环境下的监控。如果有研发能力,也可以自研Agent,与企业现有的监控平台更加契合。
收起