prometheus和alertmamager本身怎么做监控?

当使用prometheus+aletmanager监控k8s集群的时候,“谁监视值班人员”将成为一个有趣且相关的问题,尤其是当prometheus有很多单独的组件和活动部件时。
一种做法是部署第二个pomtheus实例来进行交叉检查第一个prometheus实例和一对alertmanager,aertmanager通过gossip协议进行同步。但是这种做法有点复杂。
另一种做法是安排一个cron任务进行工作,尝试向promethes询问alertmanager的状态;如果prometheus回答并说aletmanager已启动,则表示运行正常(用curl通过prometeus的HTTP API进行查询,从返回中提取内容)。但是没有任何检查来确保Alertmanager可以成功发送警报。
想在这里探讨,是否有其他的方式来对“”值班人“”进行监控,即对作为监控本身的promtheus是否有简单有效的监控,当监控本身故障了能够及时发现。

参与2

0同行回答

“答”则兼济天下,请您为题主分忧!

相关问题

相关资料

相关文章

问题状态

  • 发布时间:2020-07-29
  • 关注会员:2 人
  • 问题浏览:1696
  • X社区推广